日本の大学院生か、国内バイオベンチャーのジュニア研究者で、今週の「OpenAIがライフサイエンス向けGPT-Rosalindをローンチ」という見出しを見て応募を一瞬考えた人へ——まず、肩の力を抜きましょう。多分、入れません。Rosalindは「Trusted Access」というプログラムでスタートしていて、公開されたパートナーリストは製薬業界の集合写真みたいです:Amgen、Moderna、Novo Nordisk、Thermo Fisher Scientific、Oracle、NVIDIA、Allen Institute、Benchling、UCSF School of Pharmacy。それ以外の人は、ガバナンス審査と病原体悪用スクリーニングの向こう側でゲートに弾かれます。
そして日本人読者として一番大事なポイント:プログラムはローンチ時点で「適格な米国エンタープライズ顧客」限定。あなたの日本の大学・企業がすべての条件を満たしていたとしても、Rosalindは日本からアクセスできません。明確に。
ここから先が、ローンチ報道がほぼスルーした部分:OpenAIは同じ日に、50以上の生物学データベースに接続する無料のCodexプラグインを公開している。誰もが持っているメインラインのGPT-5.4モデルで動きます。日本からもアクセス制限なし。報道を読んだ人のうち、このGitHubリポジトリを知っているのはおそらく2%くらい。
この記事は、そのプラグインの使い方です。おまけで:Rosalindアクセスの現実的な見方、両者の違い、そして——もし応募するとしたら——どのタイミングがありなのか。
GPT-Rosalindとは何か、正確には?
短く:OpenAIが初めて本格的に生物学推論に振ったモデル。これまでAlphaFold、Google DeepMindの生物学プロジェクト、製薬の社内ラボが独占していた類のAI。それが今、化学、ゲノミクス、タンパク質工学、生化学、科学ツール利用にフォーカスして訓練されたChatGPTスタイルのモデルとして話しかけられる。
名前の由来は、X線結晶構造解析でDNA二重らせんの構造を明らかにしたRosalind Franklin。
技術寄り:RosalindはBixBench(バイオインフォマティクス・ベンチマーク)でpass@1スコア0.751。GPT-5.4 (0.732)、Grok 4.2 (0.698)、GPT-5 (0.728)、Gemini 3.1 Pro (0.550) を上回る。CloningQAベンチマーク(DNAクローニングプロトコル設計)では他を圧倒。RNA構造予測では、人間の専門家の95パーセンタイルを超える。内部評価では、化学、生化学、系統発生学、実験設計、ツール使用の全領域でGPT-5、GPT-5.2、GPT-5.4を超えた。
OpenAIのポジショニング:Rosalindは研究者の代わりをするものではない——今、大学院生やポスドクの時間を食い潰している、文献合成、データベース検索、実験計画の数時間を巻き取る存在。仮説から検証済み実験までの時間が短くなる。無駄足が減る。
それがピッチ。現実はもうちょっと面白い。
誰が実際にアクセスできるのか(正直な答え)
RosalindはTrusted Access Programのリサーチプレビューとして動いていて、プログラムには3つの明文化された要件がある:
- 公共の便益が明確な、正当な科学研究。 広く解釈される——ヒトの疾患に関する学術研究はクリア、企業の創薬プログラムもクリア。
- 適切なガバナンス、コンプライアンス、悪用防止の体制。 ここが本物の関門。モデルの出力が悪用されないことを証明できる組織インフラが必要——病原体エンジニアリング、生物兵器前駆物質の合成、そのあたりの懸念。
- 安全で管理された環境内の承認済みユーザー。 自宅のノートパソコンじゃダメ。通常はエンタープライズSSO付きのワークスペースで、特定の機関に紐づけられていること。
ローンチ時は米国エンタープライズ顧客限定。新規ユーザーは、承認済み組織の中であっても、追加の病原体悪用スクリーニングを通る必要がある。
日本の文脈で実際どういうことかというと:武田薬品、第一三共、アステラス、中外製薬、エーザイ、大塚製薬などの大手製薬で、米国子会社や研究拠点がすでにパートナーに入っている、あるいは入る予定——これが一番現実的な経路。日本国内のR01アカデミック研究室、理研、iPS細胞研究所、産総研、バイオベンチャー、大学院生、ポスドク、サイエンスジャーナリスト、政策アナリスト——ほぼ入れない。
業界のあるオブザーバーがXでスッキリまとめていた:「能力は本物。堀はアクセスポリシー」。この見方が正しい。Rosalindは一般公開モデルじゃない。たまたまChatGPTインターフェースを使っているだけの、ゲートされたエンタープライズ製品。
Codex Life Sciencesプラグインとは?
ここが面白いところ。OpenAIはRosalindと同じ日に、Codex Life SciencesというプラグインもGitHubで公開している。無料。オープン。メインラインのGPT-5.4で動く。日本からアクセス制限なし。 そして50以上の生物学データベース——バイオインフォマティシャンが毎日叩いているのと同じデータベース——に自然言語経由でつながる。
OpenAIのプロダクトリードの1人Kevin Weilは、ローンチ日のX投稿で確認している:「本日、Codex用のLife Sciencesプラグインもすべての人向けにローンチします。メインラインモデルとGPT-Rosalindの両方で動作します」。
OpenTargetsで遺伝子を調べ、ClinVarで変異をクロスリファレンス、Human Protein Atlasで組織発現を確認、関連するAlphaFold構造を見つけ、それからPubMedで最新の論文を掘る——というワークフローをやったことがあるなら、それが「午後まるまる」コースだったと分かるはず。プラグインはそれを「1つの質問、1つのセッション、1つの回答」に圧縮する。
接続される50+のデータベース
技術寄りのフルリスト:
- 遺伝学と変異: OpenTargets、GWAS Catalog、ClinVar、gnomAD、Ensembl、EVA、FinnGen、UK Biobank、dbGaP
- 発現と機能: Bgee、Human Protein Atlas、CellxGene、ENCODE、RNA Central
- 構造とパスウェイ: AlphaFold、RCSB PDB、UniProt、STRING、Reactome
- 化学: ChEMBL、PubChem、ChEBI、PharmGKB、HMDB
- 臨床: ClinicalTrials.gov、cBioPortal、CIViC
- 文献: PubMed、bioRxiv、BioStudies、NCBI Datasets
それぞれが、バイオインフォマティシャンや薬理学者が通常は別のポータル・別のクエリ言語で叩くデータベース。プラグインはそれらへのアクセスを横断的に正規化する。
プラグインを5分以内にインストール
まず、Codexを先にインストールしておく必要がある——マシンにCodex CLI、またはMacならCodex Desktop。そしてCodex内で:
/plugins install github.com/openai/plugins/life-science-research
これでスキルカタログが現在のCodexセッションに取り込まれる。インストール後は、研究上の質問を自然言語で投げるだけで、Codexが自動で適切なデータベースにルーティングする:
PCSK9遺伝子のバリアントと心血管疾患リスクの関連について、OpenTargetsは何と
言っていますか?効果量付きのトップ3関連を取り出して、ソース論文を引用して
ください。
プラグインはどのツールを呼ぶか自分で決め(この場合はOpenTargets、引用論文のためにPubMedも多分)、クエリを実行し、引用付きの統合された答えを返してくる。SQLなし。REST API認証なし。各データベースがどのIdentifierスキームを使ってるかを調べる手間もなし。
Rosalindアクセスなし、GPT-5.4だけで今日動く3つのワークフロー例:
- ターゲット探索: 「遺伝子APOEについて、GWAS Catalogから変異関連、Human Protein Atlasから発現、ClinicalTrials.govから進行中の臨床試験を引いてきてください。」
- バリアント解釈: 「私がVCFバリアントを持っています。chr17:41276135 G>A。ClinVar、gnomAD頻度、公開された症例報告を確認してください。」
- 文献スコーピング: 「過去18か月でヒト造血幹細胞におけるCRISPRベースエディティングに関する最も引用された論文3本を見つけて、それぞれが報告した効率指標を要約してください。」
これらは以前「研究の午後まるまる」案件だった。プラグインで「30秒プロンプト + 1分の読解」になる。
RosalindがプラグインにないのにできるRosalindがすること
Trusted Accessを持っている場合、「Rosalind + プラグイン」と「GPT-5.4 + プラグイン」の差は本物。公開された評価に基づくと:
| タスク | GPT-5.4 + プラグイン | GPT-Rosalind + プラグイン |
|---|---|---|
| データベース検索と統合 | 強い | 強い |
| DNAクローニングプロトコル設計 | 悪くない、修正が必要 | ほとんどのベンチマークで優位 |
| RNA構造予測 | 中くらい | 人間の95パーセンタイルを超える |
| 多段階の実験計画 | BixBench 73% | 75% |
| 化学推論 | よくある反応で良好 | 新規合成で優位 |
| 系統発生解析 | 妥当 | 明らかな優位 |
| 一般的な文献レビュー | 強い | 同等 |
| タンパク質工学推論 | 十分 | 目的特化の優位 |
要するに:無料のプラグイン on GPT-5.4は、研究者が日常必要とするものの80%をカバーする(文献、データベース、基本的な推論)。Rosalindの優位性は難しい部分で出る——新規タンパク質設計、珍しいクローニング戦略、RNA二次構造、複数の科学ドメインを同時にまたいで推論する必要がある場面。
標準的なターゲット探索や文献スコーピングをやっているなら、無料プラグインで十分。あなたの研究室で扱ったことのない遺伝子のクローニング戦略を設計するなら、違いが体感できる。
できないこと(正直に)
実験データは出てこない。 プラグインはデータベースにあるものを表に出す。実験を走らせるわけじゃない。必要なデータがまだ公開されていないなら、どれだけモデルが推論しても無理。
ハルシネーションは依然として問題。 生物学の文献は膨大で一貫性がない。プラグインは出典を引用するけど、引用が間違っている、誤帰属されている、あるいは捏造されていることもある。必ず確認。ある研究者がXで警告していた:「こういう専門モデルが本番で爆死するのを見てきた——ベンチマークには過適合、現実の汚いデータでは使い物にならない。ビルダーは、ハイプを買う前に自分のウェットラボのカオスでテストしてくれ」。ここにも当てはまる。
今は無料 — 永遠に無料ではない。 OpenAIは価格モデルをコミットしていない。プラグインはGitHub上でオープンソースなので、アクセスを絞るにはリポジトリを閉じることになり、それは変。ただしGPT-5.4のプラグイン呼び出しの裏のコンピュートが無限に無料なわけじゃない。本気で量を回すなら、100ドルのCodex Pro層を予算に入れるか、APIを使う。
レート制限は重要。 1日50のマルチツール問い合わせでChatGPT Plusの枠は食い潰される。本腰を入れた研究なら、Codex Proまたはご自身のAPI経由が前提。
EU/UK/スイスではRosalind利用不可。 組織として適格でも、Trusted Accessプログラムは米国限定(ローンチ時点)。一方、無料プラグインは世界中どこでも動く——日本からももちろん。
病原体バイオセキュリティの制限あり。 RosalindもプラグインもBiowaspen前駆体、機能獲得病原体研究、規制物質合成関連ではハードコードされた拒否あり。危険病原体の正当な研究は制度的な合意経由では可能だが、オープンなプラグイン経由では不可。
個人情報保護の注意: プロンプトとコンテキストはOpenAIに送られる。研究内容に患者データ、被験者識別子、臨床試験データが含まれる場合、先にインスティテューショナルIRBとプライバシー担当に相談。匿名化・擬似匿名化データはたいてい問題なし——でもそれは研究室の決定事項、ターミナルでの即断事項じゃない。
まだ数週間前のプロダクト。 プラグインのリリースは4月16日。バグは予想範囲内。特定のデータベース統合がたまに失敗することも想定すべき。最初の月はBreaking Changesに構えよう。
Rosalindに応募する場合の現実的ガイド
本気で適格だと思うなら、手順:
所属機関がすでに合意を持っているか確認。 OpenAIのローンチパートナー(Amgen、Moderna、Novo Nordisk、Thermo Fisher、Oracle、NVIDIA、Allen Institute、Benchling、UCSF School of Pharmacy)にはTrusted Accessがある。日本企業でも、米国子会社や研究拠点がパートナー入りしている可能性がある。まずITに聞く。
他の場合、IT・コンプライアンス部門に先に相談。 ガバナンスの部分で彼らに保証してもらう必要がある。応募書類を支援する前に、データ取り扱い、出力監査、悪用防止手順の文書化を求められるはず。
OpenAIのデベロッパー窓口経由で応募。 公開フォームはまだない——窓口はセールス・エンタープライズ。数週間の審査プロセスを覚悟。長引く可能性あり。
日本人読者の現実的なチャンス:
- トップ20製薬(武田、アステラス、第一三共など)のUS子会社経由:高い
- 資金潤沢なバイオベンチャー(Series B、$50M+):中くらい(難しい)
- 理研、iPS細胞研究所、産総研の研究者:低い——個人ではなく機関単位
- 大学院生、ポスドク:かなり低い
- 個人研究者、小規模バイオ:極めて低い
- 日本からの応募(ローンチ時点):ほぼゼロ
低いカテゴリーに入るなら、応募に1週間燃やさない。無料プラグインをインストールし、GPT-5.4と一緒に使い、OpenAIが広くアクセスを開くまで待つ。
読者別、何を意味するか
生物学の大学院生・ポスドクの場合: 今週プラグインを入れる。論文レビュー、研究助成申請、研究ローテーションで時間が数時間・数週間単位で浮く可能性。Rosalindの優位性は本物だが、日常の研究・教育には決定的ではない。プラグインを使う。Rosalindアクセスは指導教官に戦ってもらう。
企業のバイオテク・製薬にいる場合: 法務・コンプライアンス部門と相談。パートナー企業のグループ会社なら、誰かがすでにワークスペースをプロビジョニングしているか確認。そうでなければ、チーム向けにプラグインを今週入れる——時間節約は即効で効く。
バイオに興味あるエンジニア・データサイエンティスト: プラグインは、バイオの博士号なしに生物学データと関わる正当な入り口。バリアントレベルの問い(ClinVar、gnomAD)から始めて、パスウェイ・発現に進む。一週間で、教科書以上にヒトの疾患生物学を学べる。
AIの科学利用を取材・分析するジャーナリスト、政策アナリスト、教育者: プラグインで、ソースが話しているワークフローを自分で動かせる。過剰なクレームのBS検知と、本物の能力向上の判定に使える。
結論: Rosalindへのアクセスは、バイオセキュリティ・ガバナンス審査を通れる機関だけに予約されている。プラグインへのアクセスは無料、今日のGPT-5.4で動き、有用なワークフローのおそらく80%をカバーする。80%に最適化しよう。
この週末にインストールすべき人
- 今すぐ入れる: バイオ隣接ロール(研究、産業、ジャーナリズム、政策、教育)のいずれかで、複数のデータベースを手で突き合わせている自分を見つけることがある。
- 入れて評価する: バイオに興味があるエンジニア・データサイエンティストで、ずっとバイオ問題に触れたかったがツーリングが圧倒的だった。
- Trusted Accessに応募する: パートナー機関、または明確なコンプライアンスインフラを持つトップ20製薬に所属。
- 一般提供を待つ: 日本を含む米国外、コンプライアンスインフラのない小規模組織、あるいは指定されたバイオセキュリティ領域に触れる研究。
結論
Rosalindのローンチは、報道映えするタイプの事件だ——ライフサイエンス向けのフロンティアモデル、RNA予測で人間の95パーセンタイルを超え、ビッグファーマと提携。すごい。でもこれを読んでいるほとんどの人には届かない。
実際に研究をしている読者にとっての本当のニュースは、無料プラグインの方。Codexとポチャットを、すでに使っているであろう50以上のデータベースに裏打ちされた有能な研究アシスタントに変える。今日動き、費用はかからず、Rosalindで欲しかったものの大部分をカバーする。
今週末にインストールする。1時間だけ、本物の研究質問を投げる。間違えているところを見る(必ず出る)。そして、無意識に使い始めるほど正しく回答するところを見る。1か月後に戻って、まだRosalindが必要かを判断する。
ソース
- OpenAI — Introducing GPT-Rosalind for life sciences research
- GitHub — Codex Life Sciences research plugin
- The Decoder — GPT-Rosalind、ライフサイエンス向け推論モデル
- VentureBeat — GPT-Rosalind限定アクセス + GitHubでCodexプラグイン
- Implicator.ai — GPT-Rosalindはアクセスを売っている、発見ではない
- Reuters — OpenAIがGPT-Rosalindをローンチ
- Axios — ライフサイエンス創薬のためのOpenAIモデル
- Fierce Biotech — OpenAIがバイオテク特化AIモデルを発表
- Pharmaphorum — OpenAIがGPT-Rosalindを紹介