2023 рік розпочинається швидко зі стрімким розвитком впровадження штучного інтелекту, від запуску ChatGPT до AI DJing, ця технологія революціонізує традиційну практику, впливаючи на споживачів, творців і лідерів галузі.
Подібним чином технології штучного інтелекту революціонізують індустрію розваг, зокрема подкастинг. Мабуть, найбільш суперечливою частиною цієї революції є генерація голосу штучним інтелектом, яка викликає законні побоювання серед творців**, що їхні голоси використовуватимуться без дозволу. **
Однак творці подкастів мають унікальну можливість монетизувати свої голоси. **Нові інструменти дозволяють їм створювати рекламні ролики, заставки та навіть цілі епізоди з тексту, який читають ведучі, скорочуючи час, проведений у студії, і потребу у дорогому обладнанні для запису. **Але генерація голосу штучним інтелектом — це палка з двома кінцями, вона приносить як зручність, так і ризик для творців, оскільки їхній голос може бути використаний неавторизованими користувачами, спричиняючи поширення дезінформації.
Нові можливості: ШІ в аудіорекламі
Рекламодавці вже використовують технологію штучного інтелекту для точного налаштування рекламних подкастів. У лютому цього року iHeartMedia, найбільша аудіомідійна компанія в Сполучених Штатах, оголосила про партнерство з Sounder, платформою аудіорозвідки, щоб надати рекламодавцям подкастів нову технологію безпеки бренду, яка дозволяє їм оцінювати та пояснювати значення та контекст вміст подкастів перед рекламою, тим самим допомагаючи брендам приймати рішення.
Згідно з повідомленнями, iHeartMedia використовує хмарну технологію аудіоданих Sounder, щоб надати цю послугу для своїх понад 750 оригінальних шоу подкастів, включаючи деякі з найбільших у світі подкастерів і авторів. Ці шоу мають понад 392 мільйони завантажень і прослуховувань щомісяця, що перевищує сумарні права на подкасти № 2–4.
Крім того, платформа подкастингу Acast запустила новий інструмент позиціонування в розмові з використанням технології штучного інтелекту, який може розміщувати рекламу в найбільш відповідній позиції відповідно до змісту епізоду, тим самим підвищуючи ефективність реклами та безпеку бренду.
Якщо бренд хоче пропагувати свою екологічну філософію, розмовний інструмент націлювання може розмістити його рекламу в подкасті, який обговорює екологічні питання або стійкість. Це може підвищити релевантність і привабливість вашого оголошення, уникаючи конфліктів із вмістом, який не відповідає цінностям вашого бренду або торкається делікатних тем.
Зараз деякі компанії в світі досліджують, як використовувати технологію штучного інтелекту для створення повної аудіореклами. **
Наприклад, компанія з виробництва аудіореклами Adswizz розробляє інструмент генерації мовлення на основі штучного інтелекту, який допоможе рекламодавцям подкастів показувати рекламу точніше. Інструменти, розроблені лабораторією технологічних інновацій Adswizz, використовують алгоритми штучного інтелекту та машинного навчання для інтерпретації вмісту подкастів і націлювання реклами на основі вимог і цілей бренду**, усуваючи витрати на наймання акторів голосу. **
Однак оголошення, які читають вголос ведучі подкастів, виявилися ефективнішими, оскільки слухачі подкастів довіряють своїм організаторам і більш чутливі до релевантності реклами, ніж середній споживач. Це відкриває можливість для хостів самостійно використовувати голосові моделі ШІ.
Згідно з TechCrunch, Spotify використав технологію AI для створення реклами подкастів у своїй функції AI DJ, навчивши модель AI імітувати голос Ксав’єра «X» Джернігана, директора відділу культурного співробітництва та ведучого подкастів. Тепер Spotify може застосувати цю технологію для реклами.
Керівник Spotify і ведучий подкастів Білл Сіммонс розповів, що Spotify тестує технологію штучного інтелекту, яка дозволить подкастерам миттєво генерувати рекламу, яку вони читають своїм голосом. Це дозволяє творцям створювати оголошення, які звучать так, ніби ведучий читає їх за менший час, збільшуючи обсяг реклами та дохід.
Серед іншого, технологія може допомогти орієнтуватися на аудиторію та перекладати рекламу різними мовами за умови, що ведучі дозволяють відтворювати свій голос. Такий інструмент міг би залучити більше рекламодавців і творців до Spotify, відповідно до нещодавнього переходу Spotify до обслуговування незалежних творців.
Однак Spotify — не єдина платформа, яка працює з цією функцією. Наприклад, інструмент штучного інтелекту для клонування голосу під назвою Revoice, запущений Podcastle, може використовувати технологію штучного інтелекту для створення цифрового голосу, схожого на реальний хост.
Revoice простий у використанні, користувачам потрібно лише записати, як вони читають 70 різних речень, і юридичне застереження для захисту голосової безпеки та конфіденційності користувача. Алгоритм штучного інтелекту Podcastle обробляє та генерує цифровий голос користувача протягом 24 годин. Користувачі можуть вводити будь-що на платформі Podcastle і дозволяти ШІ створювати високоякісні аудіофайли з цифровими звуками.
Новий ризик: поширення дезінформації
Голоси подкастів можуть бути одним із їхніх найцінніших ресурсів. Для багатьох авторів їхній голос є єдиною ідентифікацією, особливо для тих, хто не створює подкаст-відео.
Джо Роган — відомий ведучий подкастів. Його шоу «The Joe Rogan Experience» запрошує гостей з усіх верств суспільства для глибоких розмов. Але в травні хтось використав штучний інтелект, щоб створити вигаданий подкаст, який пародіював розмови між Джо Роганом і деякими гостями, які ніколи не були на його шоу.
Подкаст називається «Joe Rogan AI Experience», створений австралійським креативним директором Г’юго, який використовує платформу перетворення тексту в мовлення, яка може клонувати будь-який голос, і генератор діалогів на основі ChatGPT. Г’юго сказав, що зробив проект просто заради розваги і не мав наміру погрожувати справжньому Джо Рогану чи іншим ведучим подкастів.
Місяць тому Г’юго випустив перший епізод подкасту, який імітував розмову між Джо Роганом і засновником OpenAI Семом Альтманом. У розмові моторошно торкаються ризиків штучного інтелекту, які створюють фейковий контент, що саме й робить цей подкаст.
Крім того, Г’юго створив кілька інших епізодів подкасту, пародіюючи розмови між Джо Роганом і такими гостями, як Ендрю Тейт і Стів Джобс. Діалог, хоча часом абсурдний або нудний, іноді може звучати реалістично або смішно. Г’юго сказав, що він сподівається продемонструвати розвиток і потенціал технології штучного інтелекту за допомогою цього проекту, а також нагадати людям бути уважними щодо небезпеки неправдивого контенту.
Тим часом TikTok також видалив фальшиву вірусну рекламу з голосом Джо Рогана.
Той факт, що журналістика є домінуючим жанром подкастингу, означає, що неправильний контент може мати серйозні наслідки, що призведе до масового поширення дезінформації. Інструменти генерації мовлення штучним інтелектом розвиваються блискавично, але на розробку регулювання щодо захисту їхніх голосів потрібен час. Тим не менш, подкастери можуть навіть використовувати штучний інтелект, щоб розповсюдити свої голоси на інші форми розваг, якщо платформи зможуть розробити ефективні заходи для запобігання зловживанням і позначення несанкціонованої роботи.
Наприклад, ведучі подкастів можуть ліцензувати свій голос для кіно та телебачення. У серії фільмів «Зоряні війни» голос Дарта Вейдера озвучив актор Джеймс Ерл Джонс, його глибокий і величний голос справив глибоке враження на глядачів. Однак 91-річний Джонс сказав, що хоче залишити цю посаду і дозволити штучному інтелекту взяти на себе верх.
Як повідомляє Vanity Fair, Джонс передав права на свою минулу озвучку компанії Disney, що дозволило українському стартапу Respeecher використовувати штучний інтелект, щоб відтворити його голос у фільмі «Обі-Ван Кенобі» Disney+.
Respeecher використовує аудіокліпи для «клонування» голосу актора, дозволяючи продюсерам записувати нові репліки без присутності актора. Меттью Вуд, головний звуковий редактор Skywalker Sound, розповів Vanity Fair, що він підняв це питання з Джонсом, коли той «згадав, що хоче відмовитися» від ролі Дарта Вейдера.
Після того, як Джонс погодився дозволити Lucasfilm використовувати голоси, створені штучним інтелектом, Vanity Fair каже, що продюсер доручив Respeecher зробити так, щоб Дарт Вейдер звучав так, як Джонс 45 років тому у фільмі Disney+ «Обі-Ван Кенобі бере на себе цю лиходійську атмосферу «темної сторони». Ось чому ви можете помітити, що в «Обі-Вані Кенобі» Дарт Вейдер схожий на нього в попередніх фільмах, а не на справжню появу Джонса в «Зоряних війнах: Сходження Скайвокера» 2019 року.
На відміну від артистів, акторів та інших творців розваг, найціннішим активом подкастерів є їхній голос. Це означає, що вони більше мотивовані досліджувати, як працювати з голосовою технологією AI, а не чинити опір їй.
Переглянути оригінал
Контент має виключно довідковий характер і не є запрошенням до участі або пропозицією. Інвестиційні, податкові чи юридичні консультації не надаються. Перегляньте Відмову від відповідальності , щоб дізнатися більше про ризики.
Як ChatGPT і AI змінюють індустрію подкастів?
Джерело: Music Finance
Автор: Редакція Little Antler
2023 рік розпочинається швидко зі стрімким розвитком впровадження штучного інтелекту, від запуску ChatGPT до AI DJing, ця технологія революціонізує традиційну практику, впливаючи на споживачів, творців і лідерів галузі.
Подібним чином технології штучного інтелекту революціонізують індустрію розваг, зокрема подкастинг. Мабуть, найбільш суперечливою частиною цієї революції є генерація голосу штучним інтелектом, яка викликає законні побоювання серед творців**, що їхні голоси використовуватимуться без дозволу. **
Однак творці подкастів мають унікальну можливість монетизувати свої голоси. **Нові інструменти дозволяють їм створювати рекламні ролики, заставки та навіть цілі епізоди з тексту, який читають ведучі, скорочуючи час, проведений у студії, і потребу у дорогому обладнанні для запису. **Але генерація голосу штучним інтелектом — це палка з двома кінцями, вона приносить як зручність, так і ризик для творців, оскільки їхній голос може бути використаний неавторизованими користувачами, спричиняючи поширення дезінформації.
Нові можливості: ШІ в аудіорекламі
Рекламодавці вже використовують технологію штучного інтелекту для точного налаштування рекламних подкастів. У лютому цього року iHeartMedia, найбільша аудіомідійна компанія в Сполучених Штатах, оголосила про партнерство з Sounder, платформою аудіорозвідки, щоб надати рекламодавцям подкастів нову технологію безпеки бренду, яка дозволяє їм оцінювати та пояснювати значення та контекст вміст подкастів перед рекламою, тим самим допомагаючи брендам приймати рішення.
Згідно з повідомленнями, iHeartMedia використовує хмарну технологію аудіоданих Sounder, щоб надати цю послугу для своїх понад 750 оригінальних шоу подкастів, включаючи деякі з найбільших у світі подкастерів і авторів. Ці шоу мають понад 392 мільйони завантажень і прослуховувань щомісяця, що перевищує сумарні права на подкасти № 2–4.
Крім того, платформа подкастингу Acast запустила новий інструмент позиціонування в розмові з використанням технології штучного інтелекту, який може розміщувати рекламу в найбільш відповідній позиції відповідно до змісту епізоду, тим самим підвищуючи ефективність реклами та безпеку бренду.
Якщо бренд хоче пропагувати свою екологічну філософію, розмовний інструмент націлювання може розмістити його рекламу в подкасті, який обговорює екологічні питання або стійкість. Це може підвищити релевантність і привабливість вашого оголошення, уникаючи конфліктів із вмістом, який не відповідає цінностям вашого бренду або торкається делікатних тем.
Зараз деякі компанії в світі досліджують, як використовувати технологію штучного інтелекту для створення повної аудіореклами. **
Наприклад, компанія з виробництва аудіореклами Adswizz розробляє інструмент генерації мовлення на основі штучного інтелекту, який допоможе рекламодавцям подкастів показувати рекламу точніше. Інструменти, розроблені лабораторією технологічних інновацій Adswizz, використовують алгоритми штучного інтелекту та машинного навчання для інтерпретації вмісту подкастів і націлювання реклами на основі вимог і цілей бренду**, усуваючи витрати на наймання акторів голосу. **
Однак оголошення, які читають вголос ведучі подкастів, виявилися ефективнішими, оскільки слухачі подкастів довіряють своїм організаторам і більш чутливі до релевантності реклами, ніж середній споживач. Це відкриває можливість для хостів самостійно використовувати голосові моделі ШІ.
Згідно з TechCrunch, Spotify використав технологію AI для створення реклами подкастів у своїй функції AI DJ, навчивши модель AI імітувати голос Ксав’єра «X» Джернігана, директора відділу культурного співробітництва та ведучого подкастів. Тепер Spotify може застосувати цю технологію для реклами.
Керівник Spotify і ведучий подкастів Білл Сіммонс розповів, що Spotify тестує технологію штучного інтелекту, яка дозволить подкастерам миттєво генерувати рекламу, яку вони читають своїм голосом. Це дозволяє творцям створювати оголошення, які звучать так, ніби ведучий читає їх за менший час, збільшуючи обсяг реклами та дохід.
Серед іншого, технологія може допомогти орієнтуватися на аудиторію та перекладати рекламу різними мовами за умови, що ведучі дозволяють відтворювати свій голос. Такий інструмент міг би залучити більше рекламодавців і творців до Spotify, відповідно до нещодавнього переходу Spotify до обслуговування незалежних творців.
Однак Spotify — не єдина платформа, яка працює з цією функцією. Наприклад, інструмент штучного інтелекту для клонування голосу під назвою Revoice, запущений Podcastle, може використовувати технологію штучного інтелекту для створення цифрового голосу, схожого на реальний хост.
Revoice простий у використанні, користувачам потрібно лише записати, як вони читають 70 різних речень, і юридичне застереження для захисту голосової безпеки та конфіденційності користувача. Алгоритм штучного інтелекту Podcastle обробляє та генерує цифровий голос користувача протягом 24 годин. Користувачі можуть вводити будь-що на платформі Podcastle і дозволяти ШІ створювати високоякісні аудіофайли з цифровими звуками.
Новий ризик: поширення дезінформації
Голоси подкастів можуть бути одним із їхніх найцінніших ресурсів. Для багатьох авторів їхній голос є єдиною ідентифікацією, особливо для тих, хто не створює подкаст-відео.
Джо Роган — відомий ведучий подкастів. Його шоу «The Joe Rogan Experience» запрошує гостей з усіх верств суспільства для глибоких розмов. Але в травні хтось використав штучний інтелект, щоб створити вигаданий подкаст, який пародіював розмови між Джо Роганом і деякими гостями, які ніколи не були на його шоу.
Подкаст називається «Joe Rogan AI Experience», створений австралійським креативним директором Г’юго, який використовує платформу перетворення тексту в мовлення, яка може клонувати будь-який голос, і генератор діалогів на основі ChatGPT. Г’юго сказав, що зробив проект просто заради розваги і не мав наміру погрожувати справжньому Джо Рогану чи іншим ведучим подкастів.
Місяць тому Г’юго випустив перший епізод подкасту, який імітував розмову між Джо Роганом і засновником OpenAI Семом Альтманом. У розмові моторошно торкаються ризиків штучного інтелекту, які створюють фейковий контент, що саме й робить цей подкаст.
Крім того, Г’юго створив кілька інших епізодів подкасту, пародіюючи розмови між Джо Роганом і такими гостями, як Ендрю Тейт і Стів Джобс. Діалог, хоча часом абсурдний або нудний, іноді може звучати реалістично або смішно. Г’юго сказав, що він сподівається продемонструвати розвиток і потенціал технології штучного інтелекту за допомогою цього проекту, а також нагадати людям бути уважними щодо небезпеки неправдивого контенту.
Тим часом TikTok також видалив фальшиву вірусну рекламу з голосом Джо Рогана.
Той факт, що журналістика є домінуючим жанром подкастингу, означає, що неправильний контент може мати серйозні наслідки, що призведе до масового поширення дезінформації. Інструменти генерації мовлення штучним інтелектом розвиваються блискавично, але на розробку регулювання щодо захисту їхніх голосів потрібен час. Тим не менш, подкастери можуть навіть використовувати штучний інтелект, щоб розповсюдити свої голоси на інші форми розваг, якщо платформи зможуть розробити ефективні заходи для запобігання зловживанням і позначення несанкціонованої роботи.
Наприклад, ведучі подкастів можуть ліцензувати свій голос для кіно та телебачення. У серії фільмів «Зоряні війни» голос Дарта Вейдера озвучив актор Джеймс Ерл Джонс, його глибокий і величний голос справив глибоке враження на глядачів. Однак 91-річний Джонс сказав, що хоче залишити цю посаду і дозволити штучному інтелекту взяти на себе верх.
Як повідомляє Vanity Fair, Джонс передав права на свою минулу озвучку компанії Disney, що дозволило українському стартапу Respeecher використовувати штучний інтелект, щоб відтворити його голос у фільмі «Обі-Ван Кенобі» Disney+.
Respeecher використовує аудіокліпи для «клонування» голосу актора, дозволяючи продюсерам записувати нові репліки без присутності актора. Меттью Вуд, головний звуковий редактор Skywalker Sound, розповів Vanity Fair, що він підняв це питання з Джонсом, коли той «згадав, що хоче відмовитися» від ролі Дарта Вейдера.
Після того, як Джонс погодився дозволити Lucasfilm використовувати голоси, створені штучним інтелектом, Vanity Fair каже, що продюсер доручив Respeecher зробити так, щоб Дарт Вейдер звучав так, як Джонс 45 років тому у фільмі Disney+ «Обі-Ван Кенобі бере на себе цю лиходійську атмосферу «темної сторони». Ось чому ви можете помітити, що в «Обі-Вані Кенобі» Дарт Вейдер схожий на нього в попередніх фільмах, а не на справжню появу Джонса в «Зоряних війнах: Сходження Скайвокера» 2019 року.
На відміну від артистів, акторів та інших творців розваг, найціннішим активом подкастерів є їхній голос. Це означає, що вони більше мотивовані досліджувати, як працювати з голосовою технологією AI, а не чинити опір їй.