ChatGPT và AI đang thay đổi ngành podcast như thế nào?

Nguồn gốc: Music Finance

Tác giả: Ban biên tập Gạc Nhỏ

Nguồn hình ảnh: Được tạo bởi Unbounded AI‌

Năm 2023 bắt đầu nhanh chóng với sự phát triển nhanh chóng của việc áp dụng trí tuệ nhân tạo, từ việc ra mắt ChatGPT đến AI DJing, công nghệ này đang cách mạng hóa hoạt động thông thường, ảnh hưởng đến người tiêu dùng, người sáng tạo và những người dẫn đầu ngành.

Tương tự như vậy, các công nghệ AI đang cách mạng hóa ngành công nghiệp giải trí, bao gồm cả podcasting. Có lẽ phần gây tranh cãi nhất của cuộc cách mạng này là tạo giọng nói AI, điều này làm dấy lên mối lo ngại chính đáng giữa những người sáng tạo** rằng giọng nói của họ sẽ bị sử dụng trái phép. **

Tuy nhiên, những người tạo podcast có cơ hội duy nhất để kiếm tiền từ giọng nói của họ. **Các công cụ mới cho phép họ tạo quảng cáo, phần giới thiệu và thậm chí toàn bộ tập từ văn bản mà máy chủ đọc, giảm thời gian dành cho phòng thu và nhu cầu về thiết bị ghi âm đắt tiền. **Nhưng tạo giọng nói AI là con dao hai lưỡi, nó mang lại cả sự thuận tiện và rủi ro cho người sáng tạo, vì giọng nói của họ có thể bị người dùng trái phép sử dụng sai mục đích, khiến thông tin sai lệch lan truyền.

Cơ hội mới: AI trong Quảng cáo âm thanh

Các nhà quảng cáo đã sử dụng công nghệ trí tuệ nhân tạo để tinh chỉnh quảng cáo podcast. Vào tháng 2 năm nay, iHeartMedia, công ty truyền thông âm thanh lớn nhất ở Hoa Kỳ, đã công bố hợp tác với Sounder, một nền tảng thông minh về âm thanh, để cung cấp cho các nhà quảng cáo podcast công nghệ an toàn thương hiệu mới cho phép họ đánh giá và giải thích ý nghĩa cũng như bối cảnh của nội dung podcast trước khi quảng cáo, từ đó giúp thương hiệu đưa ra quyết định.

Theo báo cáo, iHeartMedia tận dụng công nghệ đám mây dữ liệu âm thanh của Sounder để cung cấp dịch vụ này cho hơn 750 chương trình podcast gốc, bao gồm một số nhà sáng tạo và người tạo podcast lớn nhất thế giới. Những chương trình này có hơn 392 triệu lượt tải xuống và nghe hàng tháng, nhiều hơn cả quyền podcast từ số 2 đến số 4 cộng lại.

Ngoài ra, nền tảng podcasting Acast đã ra mắt công cụ định vị đàm thoại mới sử dụng công nghệ trí tuệ nhân tạo, có thể đặt quảng cáo ở vị trí phù hợp nhất theo nội dung của tập phim, từ đó nâng cao hiệu quả quảng cáo và độ an toàn cho thương hiệu.

Nếu một thương hiệu muốn quảng bá triết lý thân thiện với môi trường của mình, một công cụ nhắm mục tiêu trò chuyện có thể đặt quảng cáo của thương hiệu đó trên một podcast thảo luận về các vấn đề môi trường hoặc tính bền vững. Điều này có thể làm tăng mức độ liên quan và hấp dẫn của quảng cáo, đồng thời tránh xung đột với nội dung không phù hợp với giá trị thương hiệu của bạn hoặc đụng chạm đến các chủ đề nhạy cảm.

Giờ đây, một số công ty trên thế giới đang khám phá cách sử dụng công nghệ trí tuệ nhân tạo để tạo ra các quảng cáo âm thanh hoàn chỉnh. **

Ví dụ: công ty công nghệ quảng cáo âm thanh Adswizz đang phát triển một công cụ tạo giọng nói dựa trên trí tuệ nhân tạo được thiết kế để giúp các nhà quảng cáo podcast phân phối quảng cáo chính xác hơn. Được phát triển bởi Phòng thí nghiệm đổi mới công nghệ của Adswizz, các công cụ này tận dụng AI và thuật toán máy học để diễn giải nội dung podcast và nhắm mục tiêu quảng cáo dựa trên các yêu cầu và mục tiêu của thương hiệu,** loại bỏ chi phí thuê diễn viên lồng tiếng. **

Tuy nhiên, quảng cáo do người dẫn chương trình podcast đọc to được cho là hiệu quả hơn vì người nghe podcast tin tưởng người dẫn chương trình của họ và nhạy cảm hơn với mức độ liên quan của quảng cáo so với người tiêu dùng bình thường. Điều này mở ra cơ hội cho những người dẫn chương trình tự tận dụng các mẫu giọng nói AI.

Theo TechCrunch, Spotify đã sử dụng công nghệ AI để tạo quảng cáo podcast trong tính năng AI DJ của mình, bằng cách đào tạo một mô hình AI để bắt chước giọng nói của Xavier "X" Jernigan, giám đốc bộ phận hợp tác văn hóa và người dẫn chương trình podcast. Giờ đây, Spotify có thể áp dụng công nghệ này vào quảng cáo.

Giám đốc điều hành Spotify và người dẫn chương trình podcast Bill Simmons tiết lộ rằng Spotify đang thử nghiệm công nghệ trí tuệ nhân tạo cho phép các podcast tạo ngay lập tức các quảng cáo được đọc bằng giọng nói của chính họ. Điều này cho phép người sáng tạo tạo quảng cáo giống như người dẫn chương trình đang đọc chúng trong thời gian ngắn hơn, tăng số lượng quảng cáo và doanh thu.

Trong số những thứ khác, công nghệ này có thể giúp nhắm mục tiêu đối tượng và dịch quảng cáo sang nhiều ngôn ngữ khác nhau, miễn là người dẫn chương trình cho phép sao chép giọng nói của họ. Một công cụ như vậy có thể thu hút nhiều nhà quảng cáo và người sáng tạo hơn đến với Spotify, phù hợp với sự thay đổi gần đây của Spotify đối với việc phục vụ những người sáng tạo độc lập.

Tuy nhiên, Spotify không phải là nền tảng duy nhất hoạt động trên loại chức năng này. Ví dụ: công cụ nhân bản giọng nói AI có tên Revoice do Podcastle ra mắt có thể sử dụng công nghệ AI để tạo giọng nói kỹ thuật số tương tự như máy chủ thực.

Revoice rất dễ sử dụng, người dùng chỉ cần ghi âm mình đọc 70 câu khác nhau và tuyên bố từ chối trách nhiệm pháp lý để bảo vệ quyền riêng tư và bảo mật giọng nói của người dùng. Sau đó, thuật toán AI của Podcastle sẽ xử lý và tạo giọng nói kỹ thuật số của người dùng trong vòng 24 giờ. Người dùng có thể nhập bất cứ thứ gì trên nền tảng Podcastle và để AI tạo các tệp âm thanh chất lượng cao với âm thanh kỹ thuật số.

Rủi ro mới: Truyền bá thông tin sai lệch

Giọng nói podcast có thể là một trong những tài nguyên quý giá nhất của họ. Đối với nhiều người sáng tạo, giọng nói của họ là đặc điểm nhận dạng duy nhất của họ, đặc biệt là những người không tạo video podcast.

Joe Rogan là một người dẫn chương trình podcast nổi tiếng. Chương trình "Trải nghiệm Joe Rogan" của anh ấy mời những vị khách từ mọi tầng lớp xã hội tiến hành các cuộc trò chuyện chuyên sâu. Nhưng vào tháng 5, ai đó đã sử dụng trí tuệ nhân tạo để tạo một podcast hư cấu nhại lại các cuộc trò chuyện giữa Joe Rogan và một số khách mời chưa từng tham gia chương trình của anh ấy.

Podcast có tên "Joe Rogan AI Experience", được sản xuất bởi giám đốc sáng tạo người Úc Hugo, người sử dụng nền tảng chuyển văn bản thành giọng nói có thể sao chép bất kỳ giọng nói nào và trình tạo đối thoại dựa trên ChatGPT. Hugo cho biết anh thực hiện dự án chỉ để giải trí và không có ý định đe dọa Joe Rogan thật hay những người dẫn chương trình podcast khác.

Hugo đã phát hành tập đầu tiên của podcast một tháng trước, mô phỏng cuộc trò chuyện giữa Joe Rogan và người sáng lập OpenAI Sam Altman. Cuộc trò chuyện kỳ lạ đề cập đến những rủi ro của việc trí tuệ nhân tạo tạo ra nội dung giả mạo, đó chính xác là những gì podcast này làm.

Ngoài ra, Hugo đã sản xuất một số tập podcast khác, nhại lại các cuộc trò chuyện giữa Joe Rogan và các khách mời như Andrew Tate và Steve Jobs. Cuộc đối thoại, đôi khi vô lý hoặc nhàm chán, cũng có thể nghe thực tế hoặc thú vị vào những thời điểm khác. Hugo cho biết anh hy vọng có thể chứng minh sự phát triển và tiềm năng của công nghệ trí tuệ nhân tạo thông qua dự án này, đồng thời nhắc nhở mọi người cảnh giác với sự nguy hiểm của nội dung sai lệch.

Trong khi đó, TikTok cũng đã xóa một quảng cáo lan truyền giả mạo có giọng nói của Joe Rogan.

Thực tế là báo chí là thể loại podcasting thống trị có nghĩa là nội dung sai có thể gây ra hậu quả nghiêm trọng, dẫn đến sự lan truyền hàng loạt thông tin sai lệch. Các công cụ tạo giọng nói AI đang phát triển với tốc độ cực nhanh, nhưng quy định xung quanh việc bảo vệ giọng nói của chúng sẽ cần thời gian để phát triển. Tuy nhiên, những người làm podcast thậm chí có thể sử dụng AI để mở rộng tiếng nói của họ sang các hình thức giải trí khác, nếu các nền tảng có thể phát triển các biện pháp hiệu quả để ngăn chặn việc lạm dụng và gắn cờ công việc trái phép.

Ví dụ: người dẫn chương trình podcast có thể cấp phép giọng nói của họ cho phim và truyền hình. Trong loạt phim "Chiến tranh giữa các vì sao", nhân vật Darth Vader đã được lồng tiếng bởi nam diễn viên James Earl Jones, giọng nói trầm ấm và uy nghiêm của anh đã để lại ấn tượng sâu sắc trong lòng khán giả. Tuy nhiên, Jones, 91 tuổi, cho biết ông muốn từ bỏ vai trò đó và để trí tuệ nhân tạo tiếp quản.

Theo Vanity Fair, Jones đã chuyển quyền đối với tác phẩm lồng tiếng trước đây của mình cho Disney, cho phép công ty khởi nghiệp Respeecher của Ukraine sử dụng trí tuệ nhân tạo để tái tạo giọng nói của anh ấy trong Obi-Wan Kenobi của Disney+.

Respeecher sử dụng các đoạn âm thanh để "sao chép" giọng nói của diễn viên, cho phép nhà sản xuất ghi lại lời thoại mới mà không cần diễn viên có mặt. Matthew Wood, giám sát biên tập âm thanh tại Skywalker Sound, nói với Vanity Fair rằng anh ấy đã đưa ra lựa chọn với Jones khi anh ấy "đề cập rằng anh ấy muốn từ bỏ" vai Darth Vader.

Sau khi Jones đồng ý để Lucasfilm sử dụng giọng nói do AI tạo ra, Vanity Fair cho biết nhà sản xuất đã ủy quyền cho Respeecher làm cho Darth Vader giống như cách Jones đã làm 45 năm trước trong Obi-Wan Kenobi của Disney+. Đó là lý do tại sao bạn có thể nhận thấy rằng trong Obi-Wan Kenobi, Darth Vader nghe rất giống anh ấy trong các bộ phim trước đó, hơn là sự xuất hiện thực tế của Jones trong Star Wars: The Rise of Skywalker năm 2019.

Không giống như các nghệ sĩ, diễn viên và những người sáng tạo nội dung giải trí khác, tài sản quý giá nhất của người làm podcast là giọng nói của họ—nghĩa là họ có nhiều động lực hơn để khám phá cách làm việc với công nghệ giọng nói AI, thay vì chống lại nó.

Xem bản gốc
Nội dung chỉ mang tính chất tham khảo, không phải là lời chào mời hay đề nghị. Không cung cấp tư vấn về đầu tư, thuế hoặc pháp lý. Xem Tuyên bố miễn trừ trách nhiệm để biết thêm thông tin về rủi ro.
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate.io
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)