ChatGPTが世間を席巻していますが、科学雑誌NatureでChatGPTについて取り上げた2本についてメモ。
一つ目はChatGPT等のGenerative AIについて、今後の開発方針について示唆をなげかけた記事です。
気になった個所としては現在や将来の利用法について述べた部分の太字のところです。
This technology has far-reaching consequences for science and society. Researchers and others have already used ChatGPT and other large language models to write essays and talks, summarize literature, draft and improve papers, as well as identify research gaps and write computer code, including statistical analyses. Soon this technology will evolve to the point that it can design experiments, write and complete manuscripts, conduct peer review and support editorial decisions to accept or reject manuscripts.
ChatGPT: five priorities for research (nature.com)
以前の記事でも触れましたが、論文書く際の校閲に使ったり、実験手法を聞いたりしていくと、秘密情報が誤って書き込まれるリスクが高まります。生産性の向上の観点から現場は使いたがるでしょうから、どうしていくか考えていく必要があるかもしれません。
www.patent-topics-explorer.com
当然なことではありますが、ChatGPTから出た文章は、誤情報が含まれていたり、他人の著作権に触れるものが出てくる可能性があります(その際に著作権侵害になるのかは議論があるところですが、、)。
また、 論文などでは引用などを適切に行っていくことが必要ですが、ChatGPTは出典を明らかにしないので、出典探し(本当に正しいのかも含めて)をするといった意味では工数がかかるかもしれません。
こちらはGenerative AIを医薬に応用しているスタートアップが紹介されています。ProGen等は自然言語モデルを使用して新しいタンパク質を生成しようとしているようです。
また、AIとバイオの融合で、OpenBioMLという取り組みがありますが、こちらChatGPTを作ったOpenAIもサポートしているそうです。
例えば、DNA Diffusionというプロジェクトなんかが動いているようです。ヒトゲノムの中から、Generative AIのDiffusionモデルをあてて、regulatory elementを探そうとしたりしているみたいです。
余談ですが、大規模言語モデルにデータを食わせていくとあることろで能力が飛躍的に向上する場合があるといっているケースもあるので、ヒトゲノムのようにデータが大量にそろっていると素地はそろっているかもしれないですね。