More
    ¥0

    お買い物カゴに商品がありません。

    ホームAIニュースOpenAI重磅発表Sora 2、AI動画生成が再アップグレード、「AI版TikTok」で創造的新体験を開始

    OpenAI重磅発表Sora 2、AI動画生成が再アップグレード、「AI版TikTok」で創造的新体験を開始

    10月1日未明、OpenAIは旗艦動画・音声生成モデルSora 2を発表し、「AI版TikTok」——Soraアプリケーションを発表した。

    OpenAIはSora 2を「動画分野のGPT-3.5モーメント」と称している。従来のSoraと比較して、Sora 2はより精密で現実的な物理世界のシミュレーションが可能で、制御しやすく、同期対話と音響効果もサポートしている。

    公式発表の動画デモから見ると、従来の動画生成モデルでは困難だった以下のことが実現できる:オリンピック体操動作、浮力とパドルボード上でのバックフリップの精密シミュレーション、そしてフィギュアスケート選手が頭に猫を乗せて3回転半ジャンプを行うこと。

    ▲プロンプト:フィギュアスケート選手が頭に猫を乗せて3回転半ジャンプを演技

    Soraアプリケーションはソーシャルアプリとして位置づけられ、ユーザーが自分で生成した動画をアップロードし、「カメオ」機能を通じて友人の動画制作に参加できる。OpenAIの目標は、全く新しい独特な人間関係コミュニケーション方式の構築を試みることである。

    ▲OpenAIがソーシャルアプリSoraを発表

    現在、Sora iOSアプリケーションはダウンロード開始され、招待制でアメリカとカナダで展開されている。招待コードを取得したユーザーはSora公式サイトでSora 2を無料体験でき、ChatGPT Proユーザーはより高品質なSora 2 Proモデルを体験できる。

    Sora 2の発表は海外ネットで大きな話題となり、大部分の人が招待コードを求め、一部の人はすでに招待コードを入手している。ソーシャルプラットフォームX上にはすぐにSora 2生成動画が多数現れ、OpenAI CEOサム・アルトマンまでも「遊ばれて」しまった。

    同時に多くの人が懸念を示し、Xのあるユーザーは「数ヶ月後、我々は何が真実で何が真実でないかを区別できなくなる。それは恐ろしい時代になるだろう」と述べた。

    ▲ソーシャルプラットフォームXのネットユーザーコメント

    一、Sora 2登場:「動画分野のGPT-3.5モーメント」

    OpenAIによると、2024年2月に発表されたSoraは多くの面で動画分野の「GPT-1モーメント」と言える——動画生成が初めて効果を示し始め、事前訓練計算能力の拡張により、オブジェクトの持続性などの需要が実現された。

    OpenAIはSora 2を「動画分野のGPT-3.5モーメント」と称している。従来の動画モデルは、テキストプロンプトを成功実行するためにオブジェクトを変形させ現実を歪曲することが多かった。例えば、バスケットボール選手がシュートを外した場合、ボールが自動的にバスケットに転送される可能性があった。しかしSora 2では、バスケットボール選手がシュートを外した場合、ボールはバックボードから跳ね返る。

    また、以下のSora 2が生成したバックフリップ動画では、演技者は着地後にふらつき、小さなミスによる少し恥ずかしそうな表情まで顔に現れ、現実生活のシーンに非常に似ている。

    ▲プロンプト:一人がバックフリップをする

    興味深いことに、このモデルが犯す「エラー」は、しばしばSora 2が暗黙的にモデル化した内部エージェントが犯すエラーのように見える。まだ完璧ではないが、従来のシステムと比較して、物理法則の遵守においてより良い性能を示している。

    OpenAIは、有用な世界シミュレーターにとって、これは極めて重要な能力だと考えている——成功だけでなく、失敗もシミュレートできなければならない。

    このモデルは制御性においても大きな飛躍を実現し、複数のショットにわたる複雑な指示を実行しながら、世界状態を精密に保持できる。リアル、映画、アニメスタイルの処理に長けている。

    ▲プロンプト:バイキングが参戦——北海発射(10.0秒、冬の涼しい日光/中世初期)……

    汎用動画音声生成システムとして、高度にリアルな複雑な背景音響、音声、音響効果を創造できる。

    ▲プロンプト:明るい色の技術装甲を着た二人の登山探検者、顔に氷が付着し、目を細めて、雪の中で切実に叫んでいる、一人ずつ

    ユーザーは現実世界の要素をSora 2に直接注入することもできる。例えば、チームメンバーの動画を観察することで、モデルはその人をSoraが生成した任意の環境に挿入し、外見と声を正確に描写できる。この機能は非常に汎用的で、あらゆる人間、動物、オブジェクトに適用される。

    ▲プロンプト:ビッグフットは彼に本当に良くしてくれる、少し良すぎるほど、良すぎて少し奇妙だ。ビッグフットは彼と一緒に遊びたがるが、彼はあまりにも遊びたがりすぎる。

    OpenAIによると、このモデルは完璧には程遠く、多くのエラーが存在するが、動画データ上でのニューラルネットワークのさらなる拡張が現実のシミュレーションにより近づけることを証明している。

    二、AI版TikTok発表、実人物「カメオ」動画、新ソーシャルツール?

    今日、OpenAIは「Sora」という名前の全く新しいiOSソーシャルアプリケーションも発表した。このアプリはSora 2によって支援されている。

    アプリ内で、ユーザーは創作し、お互いの創作スタイルをミックスし、カスタマイズ可能なSoraフィードで新しい動画を発見し、「カメオ(Cameos)」機能を通じて自分や友人を動画に導入できる。カメオ機能を使用すると、ユーザーはアプリ内で短い音声動画録画を一度行うだけで、驚くべき忠実度で自分を任意のSoraシーンに直接持ち込むことができる。

    これはAI版のTikTokやTikTokのように見え、OpenAIは、この「カメオ」機能を中心に構築されたソーシャルアプリがSora 2体験の魅力の核心だと考えている。

    数ヶ月前、OpenAIのSoraチームは「自分で生成した動画をアップロード」する機能を試し始め、皆が楽しんでいた。OpenAIによると、これはコミュニケーション方式の自然な進化のように感じられる——テキストメッセージから絵文字、音声メモ、そして今の動画へ。

    先週、OpenAIは全社員に内部でこのアプリを発表した。すでに同僚からのフィードバックで、この機能を通じて会社で新しい友人を作ったという報告がある。

    三、招待制発表、Sora 2無料利用可能、Proユーザーはより高級な体験

    OpenAIはSoraアプリを招待制で発表し、ユーザーが友人と一緒に使用できることを保証している。

    招待を受けた後、ユーザーはsora.comを通じてSora 2にアクセスすることもできる。Sora 2は最初は無料で提供されるが、これらの機能は依然として計算能力の制限を受ける。ChatGPT Proユーザーはsora.com上で実験的な、より高品質なSora 2 Proモデルを使用することもできる。

    OpenAIはAPIでSora 2を発表する計画もある。Sora 1 Turboは引き続き利用可能で、ユーザーが作成したすべてのコンテンツもsora.com内に継続して存在する。

    中毒などの問題を防ぐため、OpenAIは一連の措置を講じる。

    一つは、ユーザーにツールと自主選択権を提供し、情報フロー内のコンテンツを制御できるようにすること。OpenAIの既存の大規模言語モデルを利用して、自然言語で指導できる新しいタイプの推薦アルゴリズムを開発し、ユーザーの健康状態を定期的に調査し、情報フローを調整するオプションを積極的に提供するメカニズムも内蔵している。

    デフォルトでは、OpenAIはユーザーに主にフォローまたはインタラクションした人向けのコンテンツを表示し、モデルがユーザーが創作インスピレーションとして使用する可能性が最も高いと考える動画を優先表示する。ユーザーが情報フィードで費やす時間に対して最適化せず、このアプリの設計初心は消費量ではなく創作量を最大化することを明確にしている。

    青少年保護の面では、OpenAIはChatGPTを通じてSora保護者制御機能を発表し、保護者が無限スクロール制限を上書きし、アルゴリズムパーソナライゼーションをオフにし、プライベートメッセージ設定を管理できるようにする。

    カメオ機能の面では、ユーザーはSoraとエンドツーエンドで肖像を制御できる。ユーザー本人のみが誰が自分のカメオを使用できるかを決定でき、いつでもアクセス権限を取り消したり、そのカメオを含む任意の動画を削除したりできる。ユーザーは他人が作成した下書きを含め、自分のカメオを含む動画をいつでも確認できる。

    OpenAIはこのアプリで多くの安全問題を処理している。例えば、肖像使用における十分な情報に基づく同意、出所確認、有害コンテンツの生成防止など。

    他のアプリの多くの問題はその収益モデルに起因する。OpenAIの現在唯一の計画は、利用可能な計算能力に対して需要量が過大な場合、最終的にユーザーが追加動画を生成するために一定金額を支払うことを選択できるようにすることである。

    結語:Sora 2大技を温存、動画生成産業の再編を推進か

    OpenAIが2024年2月にSoraを発表してから1年半以上が経過し、Sora 2がついに登場した。効果から見ると、このモデルは現実シミュレーション、制御性、音響効果の面で比較的大きな進歩を遂げており、動画生成産業構造の加速的再編を推進することが期待される。

    動画モデルは急速に発展しており、汎用世界シミュレーターは新しいコンテンツ生成方式を提供するだけでなく、人間関係コミュニケーション方式の再構築も期待される。OpenAIは全く新しいSoraソーシャルアプリを通じてこの目標に近づいており、動画生成モデルの実用化アプリケーションがより成熟していることを示している。

    出典:智東西


    SEO関键词: OpenAI, Sora 2, AI動画生成, ソーシャルアプリ, カメオ機能, 動画シミュレーション, ChatGPT Pro, 招待制, 物理法則, 創作ツール

    返事を書く

    あなたのコメントを入力してください。
    ここにあなたの名前を入力してください

    Must Read

    AIナビJPの最新情報をさらにチェックしましょう。

    今すぐ購読して、すべてのアーカイブ記事にアクセスしましょう。

    続きを読む