先日、OpenAIはGPT-4の構築に用いたデータセットやトレーニング方法について開示しない方針を決めたという記事がありました。
ブラックボックスとして批判する声もあり、科学の点では再現性の問題点もあります。Open AIがopenにしないのはなんでだという批判もあり、皮肉がきいています。
理由の一つに競争を挙げていますが、non profitであるOpen AIが競争を理由に挙げるのも、なかなか理解に苦しいところもあります。
Stable Difuusionなどはソースコードも開示され、責任あるAIのもとRAILライセンスという枠組みも考案されてきています。
www.patent-topics-explorer.com
AIが高度化・学習に大量のリソース等を割くようになっていくにつれ、今後最新のAIの学習データセットやパラメータ、ソースコード等がどこまで開示されるべきか今後の動向に注目です。