.webp&w=3840&q=95)
On track to help 1 million people regain their voice
Expanding beyond ALS to support MSA and mouth cancer patients with free AI voice technology
Y7とのコラボレーション作品「Y7」をお届けできることを嬉しく思います。ユニークな1時間のSF映画「 レポート 5923.以下は、Y7 アーティストによる制作体験談です。彼らは、哲学的、理論的要素を織り交ぜながら、音、音響戦争、ウイルスとしてのオーディオといったテーマを探求しています。ElevenLabs がこのプロジェクトをサポートする上で果たした役割は、アートと AI の統合を促進することでした。Y7のクリエイティブプロセスと、彼らがどのように レポート 5923 人生に。
レポート 5923 主に AI とさまざまなツールや手法を使用して制作された 1 時間の SF 映画です。この映画は、主人公のシェベクが3つの異なる惑星を旅しながら、民族誌的な報告書をまとめる様子を描いています。音、音響戦争、ウイルスとしてのオーディオは、物語全体を通して繰り返し登場するテーマであり、より広義には世界構築とテクノオプティミズムの概念を扱っています。この作品は、私たちが愛する哲学的・理論的著作、特にジル・ドゥルーズとフェリックス・ガタリの著作で出会ったアイデアを展開しようと試みています。
これは当初、 事実英国リバプールのギャラリー兼映画館である から、アーティスト、研究者、キュレーターの支援を目的とした 2023 年 6 月の 2 日間のワークショップの最後に作品を発表するよう依頼されました。「Turning Together」と題されたこのプログラムは、空想小説作家のアーシュラ・K・ル=グウィンが「母語」を互いに聞き、関係を築くことに根ざしたコミュニケーションの手段と捉えたことからその名が付けられた。上映後、幸運にもElevenlabsから映画の完成に向けての資金をすぐに確保することができました。彼らは、私たちが彼らのツールを映画制作と制作の両方で利用していることを知りました。 報告 そして私たちの幅広い実践。
に応じて 事実ル・グウィンの引用を参考に、私たちは彼女の小説にOpenAI GPT-3.5モデルを微調整することにした。 奪われた者たち AIと共同で脚本を執筆することを目標に。微調整は ChatGPT とのやり取りとは異なります。微調整では、基本的に、モデルが既に学習した一般的な言語知識に加えて、新しいデータセットに特化するようにします。一度トレーニングすると、新しいモデルはデータセットのスタイルで新しいテキストを生成できるようになります。その際に、元のテキストにどれだけ忠実に従うかを、と呼ばれるパラメータで制御できます。 温度: 温度が低いほど、テキスト出力は断片化されランダムになり、温度が高いほど、データセットの抜粋がそのまま繰り返される可能性が高くなります。それはちょうど良い妥協点を見つけることです。微調整されたモデルを ル=グウィンの雰囲気の抽出.そういう意味では、これは新しいタイプのファンフィクションです。私たちはみんなで協力して、「Ursula K. Le Guin」という名詞を動詞に変えました。私たちは今 ル・グウィン 絵を描いたり、彫刻をしたり、歌ったりできる限り。
そこで、さまざまな温度で実験してみると、物語の輪郭が浮かび上がってきました。AI との共同執筆のプロセスは、ウィリアム・バロウズをデヴィッド・ボウイ風にカットアップした手法に似ているように感じます。私たちは、テキスト出力のさまざまなスニペットをリンクさせ始めました。AI が私たちの中にアイデアを刺激し、それを AI に直接フィードバックすることもあれば、私たちが愛する作家の関連するテキストの一節をフィードバックすることもありました。結局、誰が何を書いたのか、そのアイデアはどこから来たのかを区別することが難しくなりました。ただし、これは従来の著作とそれほど変わらないと言えます。強いて言えば、執筆クレジットは私たちに有利なようにおよそ 60/40 に分割されるだろうと推定します。全体的なストーリー展開は、AI が考え出せるものではありません。これは ChatGPT では技術的には可能ですが、ChatGPT によるストーリーテリングの構造を理解すると、非常に定型的で、ハッピーエンドに奇妙に過度に依存していることがすぐにわかります。
脚本の開発と並行して、AI ツール (主に Midjourney と Runway の Gen-2) を使用してストーリーの視覚化も行われました。私たちが抱えていた主な障害の 1 つは、シュモン・バサールが「Midjourney のミッドネス」と呼んでいるものと戦うことでした。これは、多くのテキストからコンテンツを作成するツールに見られるキッチュな DeviantArt の美学への傾向であり、女性蔑視的で幼児化した女性の描写と密接に関係しています。私たちがこの問題に取り組んだ最初の方法は、過度に様式化された画像を避けるため、プロンプトに写真の専門用語を散りばめることでした。これがもたらした大きな影響の一つは 報告 それは、主人公のシェベックを若い女性から老女に変更することに繋がったことです。ミッドジャーニーは、促されると、年配の女性を極度の恐怖の対象として描くことが多いが、これは主人公にとってより豊かで、破壊的で、複雑な美的基盤であると感じた。これは、ル=グウィンの主張によって裏付けられている。 スペースクローン 年配の女性は銀河間旅行の理想的な地球代表者になるだろう。
AI を扱う際の私たちの信条は、多くの場合 (ただし、それだけではありません)、不具合や中断に身を委ねることです。つまり、AI がマスクや模倣を忘れる瞬間を作ろうとすることです。AI がプログラムされたスタイル上の罠を繰り返すのをやめ、自分自身の幻覚を逆伝播しているように感じられる素材を出力し始める場所まで AI を誘導し、促し、脱獄できるようにします。AI は、本来あるべきよりも自分自身のように振る舞っているように感じられるのです。
AIはさらに活用され、 報告 音響的に生き生きとさせる: テキストから音声へのツールと生の音声ニューラル ネットワークにより、混雑した駅のプラットフォームのフォーリーからテープ マシンの再生音、さらにはシンセサイザーの音、抽象的なボーカル、サウンドトラックのポリリズムのドラム パターンまで、あらゆるものを作り出すことができました。次に、Elevenlabs の音声合成ツールを使用してストーリーを語り、登場人物に命を吹き込みました。レポート 5923 は、私たち自身がアレンジしたニューラル ネットワークの融合であり、私たちが作るのを楽しんだのと同じくらい、皆さんも視聴して楽しんでいただければ幸いです。
Expanding beyond ALS to support MSA and mouth cancer patients with free AI voice technology
More people are listening to audiobooks than ever before. But for many independent authors, getting an audio version of their work published on major platforms has been expensive and time-consuming — until now.