Meta, Voicebox AI’yı tanıttı: Hepimiz endişelenmeli miyiz?

Şaibe · 8 Tem 2023

Muhtemelen resimler ve videolar için derin sahtekarlıklar hakkında bir şeyler duymuşsunuzdur. AI ile oluşturulan bu ürkütücü derecede gerçekçi videolar? Şimdi, görünüşe göre Meta (eski adıyla Facebook), tamamen sesle ilgili Voicebox adlı yeni bir AI modeli geliştirdi. Sadece bir metin isteminden sentetik sesler yaratabilen süper şarjlı bir metinden konuşmaya sistemi gibidir.

KURT’UN GÜVENLİK ALARMLARI, HIZLI İPUÇLARI, TEKNİK İNCELEMELER VE SİZİ DAHA AKILLI YAPABİLECEK KOLAY NASIL YAPILIR BİLGİLERİ İÇEREN ÜCRETSİZ CYBERGUY BÜLTENİNİ İNDİRMEK İÇİN TIKLAYIN

Voicebox nedir?

Voicebox, özünde basit metin istemlerine dayalı sentetik sesler oluşturan bir yapay zeka modelidir. Başka bir deyişle, ona bir metin verirsiniz ve o da bunu insan sesi gibi yüksek sesle okur. Telefonunuzda veya bilgisayarınızda kullanabileceğiniz metin okuma işlevine benzer, ancak her şeyi tamamen yeni bir düzeye taşır.

Voicebox’ı diğerlerinden ayıran bir şey, çok kısa bir ses örneğine dayalı olarak belirli ses stillerini çoğaltma yeteneğidir – iki saniye kadar kısa bir sürede konuşuyoruz! Bu, potansiyel olarak en sevdiğiniz ünlüye ve hatta kendi sesinize benzeyen sentetik bir sese sahip olabileceğiniz anlamına gelir. Neredeyse talep üzerine, seçtiğiniz ses tarzında istediğiniz her şeyi okumaya hazır bir seslendirme sanatçısına sahip olmak gibi.

Rakip AI ses modelleri

Spechify

Speechify ve ElevenLabs aynı zamanda metinden konuşmaya oyunun oyuncularıdır. Speechify, herhangi bir metni sese dönüştüren bir uygulamadır. Kitapları, makaleleri, notları, e-postaları, PDF’leri, resimleri ve web sayfalarını yüksek sesle okuyabilir. Speechify ayrıca ses klonlama, ses düzenleme ve ses örnekleme özellikleri sunduğunu iddia ediyor. Speechify yüzlerce ücretsiz eskimeyen sesli kitap sunar, bir masaüstü uygulamasına sahiptir ve okuma güçlüğü çeken kişilere yardımcı olmak için tasarlanmıştır.

Telefondaki Meta logosu (Getty Images aracılığıyla Costfoto/NurPhoto)

MARK ZUCKERBERG ‘TWITTER KILLER’ İPLİKLERİ, KULLANICILARI TOPLU VERİ TOPLAMAK KONUSUNDA ÖFKELENDİRİYOR: ‘SIFIR GİZLİLİK

Eleven Laboratuvarları

ElevenLabs ise bağlamla ilgili duygular ve doğal dil anlayışı ile sentetik sesler üretmek için yapay zekayı kullanan bir girişim. Video oyunları, animasyonlar, dijital asistanlar, eğitim, eğlence, reklamcılık ve podcasting gibi çeşitli sektörler için herhangi bir ses ve stilde yüksek kaliteli konuşma sesi oluşturmak ve özelleştirmek için bir platform sunarlar. Ayrıca sentetik sesleri algılamak ve gerçekliğini doğrulamak için bir araçları var. ElevenLabs, ses örneklerini sağlayan ve ses klonları kullanıldığında ödeme alan oyuncularla çalışır. Yapay zeka tarafından sağlanan konuşmalarını oluşturmak için özel derin öğrenme modelleri kullanıyorlar.

Her ikisi de oldukça havalı, ancak yalnızca birkaç saniyelik sesten gerçek sesleri taklit edebilen Voicebox ile aynı çok yönlülüğe sahip değiller. Bir İsviçre Çakısını gerçekten iyi birkaç kaşıkla karşılaştırmak gibi. Hepsinin kendi kullanımları var ama biri kesinlikle daha çok amaçlı.

Voicebox’ın gücü

Ama bu sadece sahte sesler yaratmakla ilgili değil. Voicebox, rahatsız edici arka plan gürültüsünü de ortadan kaldırarak sesinizi düzene sokabilir – örneğin siz kaydetmeye çalışırken bir köpeğin havlaması gibi. Ve bu sadece İngilizce ile ilgili değil. Bu yapay zeka Fransızca, İspanyolca, Almanca, Lehçe ve Portekizce de konuşuyor ve hatta aynı ses stilini korurken pasajları bir dilden diğerine çevirebiliyor.

HAREKET ETTİRİN, SIRI: APPLE’NİN YENİ SESLİ KİTAP’I YAPAY ZEKA SESİ İNSAN GİBİ SESLENİYOR

Meta (eski adıyla Facebook) logosu, 09 Kasım 2022’de Menlo Park, California’daki şirket merkezlerinin girişini işaret ediyor. tarih,” patron Mark Zuckerberg Çarşamba günü söyledi. (Getty Images aracılığıyla JOSH EDELSON/AFP)

Meta’nın Ses Kutusu: bir buluş mu yoksa bir tehdit mi?

Ne yazık ki, ya da neyse ki, AI konusunda nerede durduğuna bağlı olarak Meta, Voicebox’ı hemen açmayı planlamıyor. Bu, insanların bazı potansiyel sorunlardan kaçınmaya çalışıp çalışmadıklarını merak etmelerine neden oluyor. Örneğin yapay zeka ses teknolojisi, taciz kampanyalarında olduğu gibi olumsuz bir şekilde kullanılabilir. Veya Meta’nın bu modelden biraz para kazanmak için gelecekte bazı planları olabilir.

Voicebox’ın devasa eğitim verilerinin kaynağı

Voicebox ile ilgili ilginç bir şey, tonlarca veriyle eğitilmiş olmasıdır—İngilizce sesli kitaplardan 60.000 saatin üzerinde konuşma ve çok dilli sesli kitaplardan 50.000 saat konuşma. Meta, ana veri kaynağı olarak halka açık sesli kitapları kullandıklarını, ancak podcast’ler, konuşmalar ve radyo programları gibi diğer kaynakları da kullandıklarını söylüyor. Bununla birlikte, kalite, tutarlılık, hizalama ve konuşmacı kimliği gibi bazı zorluklar ve sınırlamalar kamuya açık sesli kitapların kullanımıyla ilişkilidir. Meta, veri işleme ve model tasarımı ile bu sorunlardan bazılarını ele aldıklarını iddia ediyor.

DAHA FAZLASI İÇİN GÜVENLİK ALARMLARI, ÜCRETSİZ CYBERGUY RAPOR BÜLTENİM İÇİN BURAYA BAŞLAYARAK ABONE OLUN CYBERGUY.COM/BÜLTEN

Teknolojinin iki ucu keskin kılıcı

OBAMA AG, YARGIÇ BİDEN YÖNETİCİSİNİN SOSYAL MEDYA ŞİRKETLERİ İLE İLETİŞİMİNİ ENGELLEDİĞİNDEN SONRA MAHKEME KARARINI YERLEŞTİRDİ

AI seslerinin yükselişi, özellikle seslendirme sanatçıları ve son zamanlarda yazarlar için biraz hassas bir konu. Seslerini ödemeden sentezlemek için AI kullanan şirketlerden endişe ediyorlar. Sesli kitap pazarı çok büyüyor ve şirketler her zaman maliyetleri düşürmeye çalışıyor, bu nedenle bu, seslendirme uzmanları için başka bir sorun haline gelebilir.

Ancak yanılma; mesele sadece iş değil. Dolandırıcılıklarda derin sahte seslerin ne kadar kullanılabileceği konusunda bazı gerçek endişeler var. Örneğin, büyük bir soygunda CEO’yu taklit eden sentetik bir sesin kullanıldığı bir durum vardı. Ayrıca, derin sahte seslerin, çevrimiçi bankacılık gibi şeyler için kullanılan ses-biyometrik sistemler gibi şeyleri karıştırmak için kullanılabileceği endişesi de var.

Görüyorsunuz, bu teknoloji kulağa ne kadar havalı gelse de, daha karanlık bir tarafı da var. Patronunuzdan bir hesabı kapatmak için büyük miktarda para aktarmanızı isteyen bir telefon aldığınızı hayal edin. Söyleneni yaparsın çünkü o senin patronun. Ama öyle değildi. Bu doğru; tıpkı patronunuz gibi ses çıkaran yapay zeka kullanılarak oluşturulmuş sahte, sentetik bir sesti. Vahşi, değil mi? Ama bu bir film konusu değil; aslında oldu! Bu, bir soygunda ilk kez sahte bir sesin kullanılmasıydı ve kolluk kuvvetleri ve AI uzmanlarının kafalarını kaşımasına neden oldu.

Condo, yapay zekanın geleceği konusunda iyimserdi. (Getty Images aracılığıyla Jakub Porzycki/NurPhoto)

DALLE-2 VS. BING CREATOR – BU AI HESAPLAMASINDA HANGİSİ BİRLİKTE ÇIKIYOR?

Ve bu sadece soygun değil. Derin sahte sesler, ses tanımaya dayanan sistemleri kandırmak için kullanılabilir. Sesinizi bir tanımlama biçimi olarak kullanan çevrimiçi bankacılık gibi şeylerden bahsediyoruz. Suçlular sizin hakkınızda ikna edici bir sahte ses oluşturabilirlerse, potansiyel olarak hesaplarınıza erişebilirler. Bu biraz sahte bir imza gibi ama bunun yerine sesiniz ile.

Deepfake tehdidine karşı koymak

Bu nedenle, teknolojinin yapabileceği harika şeylere hayret ederken, potansiyel risklerin farkında olmak ve bir adım önde olmak da önemlidir. AI uzmanları ve işletmelerin bu derin sahte sesleri herhangi bir zarar vermeden önce tespit etmek ve durdurmak için çok çalıştıkları yüksek teknolojili bir kedi ve fare oyunu gibi.

Neyse ki, derin sahte seslerin olası kötüye kullanımına karşı savaşmaya çalışan insanlar var. Örneğin, bazı ülkeler derin sahtekarlıkları düzenlemek için yasalar çıkarmaya başladı. Ayrıca, bilim adamlarının ve mühendislerin derin sahte sesli saldırılara karşı koymanın yolları üzerinde çalıştıkları Otomatik Konuşmacı Doğrulaması Sahtekarlığı ve Karşı Tedbir Mücadelesi (ASVspoof) gibi projeler de var.

Kurt’un önemli çıkarımları

Teknolojinin baş döndürücü bir hızla geliştiği ve çalışma, iletişim kurma ve hatta bir şeyler duyma şeklimizi değiştirdiği bir çağdayız. Meta’nın Ses Kutusu gibi yapay zekanın potansiyeli şüphesiz heyecan verici olsa da, dikkatli adımlar atmamız gerektiği de açık. İnovasyon ve istila arasında ince bir çizgi var, hepimizin hala çözmeye çalıştığı bir denge.

Uzmanlar, Çin ve ABD’deki AI yatırımı arasındaki farkın, Amerikan modelinin özel şirketler tarafından yönlendirilirken Çin’in bir hükümet yaklaşımı benimsemesi olduğunu savunuyor. (Getty Images aracılığıyla JOSEP LAGO/AFP)

HABERLER SUNULDU

Tüm bu ilerlemeler ve potansiyel risklerle, yapay zekanın ve derin sahte teknolojinin geleceği hakkında ne düşünüyorsunuz? Bunu bir lütuf olarak mı yoksa bir felaket olarak mı görüyorsunuz? Bize yazarak bize bildirin Cyberguy.com/İletişim

Güvenlik uyarılarımdan daha fazlası için şu adrese giderek ücretsiz CyberGuy Rapor Bültenime abone olun: Cyberguy.com/Bülten

Telif Hakkı 2023 CyberGuy.com. Her hakkı saklıdır.

Kurt “CyberGuy” Knutsson, “FOX & Friends”te sabahları Haberler & FOX Business’a yaptığı katkılarla hayatı daha iyi hale getiren teknolojiye, donanıma ve araçlara derin bir sevgi besleyen, ödüllü bir teknoloji gazetecisidir. Teknik bir sorunuz mu var? Kurt’un CyberGuy Haber Bültenini alın, CyberGuy.com’da sesinizi, bir hikaye fikrinizi veya yorumunuzu paylaşın.

Meta, Voicebox AI’yı tanıttı: Hepimiz endişelenmeli miyiz?

Şaibe

Member