Tümör nedeniyle konuşması bozulan 21 yaşındaki çocuğun sesi yapay zekayla kopyalandı

Şaibe

Member
  • 21 yaşındaki Lexi Bogan, geçen yaz doktorların beyninin arka kısmına yerleşen hayati tehlike oluşturan tümörü çıkardıktan sonra sesini kaybetti.
  • Nisan ayında, ergenlik çağındaki sesinin 15 saniyelik kaydıyla eğitilen, yapay zeka tarafından üretilen bir klon aracılığıyla sesini yeniden kazandı.
  • Bogan ve tıbbi ekibi, konuşma engeli veya kaybı olan kişiler için değerli tıbbi uygulamalara sahip olduğuna inanıyor.
Alexis “Lexi” Bogan'ın geçen yazdan önceki sesi coşkuluydu.

Arabada Taylor Swift ve Zach Bryan'ın şarkılarını söylemeyi severdi. Her zaman gülüyordu; yaramazlık yapan okul öncesi çocukları toplarken veya arka bahçedeki ateş çukurunda arkadaşlarıyla siyaset tartışırken bile. Lisede koroda sopranoydu.

Sonra o ses gitti.

YAPAY ZEKA YAŞLILARIN UZUN VADELİ BAKIM İHTİYAÇLARINI TAHMİN ETMEYE YARDIMCI OLUYOR: 'SONRAKİ KRİTİK ADIMLAR'

Ağustos ayında doktorlar, beyninin arka kısmına yakın bir yerde bulunan, hayatı tehdit eden bir tümörü çıkardılar. Bir ay sonra solunum tüpü çıktığında Bogan yutkunmakta zorlandı ve ailesine “merhaba” demek için kendini zorladı. Aylar süren rehabilitasyon iyileşmesine yardımcı oldu ama konuşması hala bozuk. Arkadaşları, yabancıları ve kendi aile üyeleri, onun onlara ne anlatmaya çalıştığını anlamakta zorluk çekiyor.



Beyin tümörü nedeniyle konuşması bozulan Alexis Bogan, 29 Nisan 2024'te Lincoln, Rhode Island'da Starbucks'ın arabaya servisinde sesli içecek siparişi oluşturmak için yapay zeka destekli bir akıllı telefon uygulaması kullanıyor. Uygulama, yazdığı girişleri orijinal sesi kullanılarak oluşturulan sözlü bir mesaja dönüştürüyor. (AP Fotoğrafı/Steven Senne)


Nisan ayında 21 yaşındaki eski sesine kavuştu. Gerçek değil, yapay zeka tarafından oluşturulmuş ve bir telefon uygulamasından çağırabildiği bir ses klonu. Bir lise projesi için kaydettiği yemek pişirme tanıtım videosundan alınan ergenlik çağındaki sesinin 15 saniyelik zaman kapsülüyle eğitilmiş olan sentetik ama son derece gerçekçi sese sahip yapay zeka sesi artık istediği neredeyse her şeyi söyleyebiliyor.

Telefonuna birkaç kelime veya cümle yazıyor ve uygulama bunu anında yüksek sesle okuyor.

Bogan'ın AI sesi, Starbucks'ta arabaya servis sırasında telefonu arabasının camından dışarı doğru tutarken, “Merhaba, lütfen buzlu kahverengi şekerli, yulaf sütüyle çalkalanmış büyük bir espresso alabilir miyim?” dedi.

YENİ YZ ARAÇLARI DOKTORLARIN NOT ALMASINA, HASTALARA MESAJ GÖNDERMESİNE YARDIMCI OLABİLİR ANCAK HALA HATA YAPIYORLAR

Uzmanlar, hızla gelişen yapay zeka ses klonlama teknolojisinin telefon dolandırıcılıklarını artırabileceği, demokratik seçimleri sekteye uğratabileceği ve hiç konuşmadıkları şeyleri söylemek için seslerinin yeniden yaratılmasına asla rıza göstermeyen insanların (canlı veya ölü) onurunu ihlal edebileceği konusunda uyardı.

New Hampshire seçmenlerine Başkan Joe Biden'ı taklit eden derin sahte otomatik çağrılar üretmek için kullanıldı. Maryland'de yetkililer yakın zamanda bir lise atletik direktörünü, okul müdürünün ırkçı sözler söylediği sahte bir ses klibini oluşturmak için yapay zekayı kullanmakla suçladı.

Ancak Bogan ve Rhode Island'ın Lifespan hastane grubundaki doktorlardan oluşan bir ekip, riskleri haklı çıkaracak bir kullanım alanı bulduklarına inanıyor. Bogan, OpenAI'nin yeni Ses Motoru ile kayıp bir sesi yeniden yaratabilen ilk insanlardan biri (bu durumdaki tek kişi). Yeni kurulan ElevenLabs gibi diğer bazı yapay zeka sağlayıcıları, benzer teknolojiyi konuşma engeli ve konuşma kaybı olan kişiler için test etti; buna şu anda ses klonunu mahkeme salonunda kullanan bir avukat da dahil.

Brown Üniversitesi tıp fakültesi ve Rhode Island Hastanesi'nde beyin cerrahisi asistanı olan Dr. Rohaid Ali, “Teknoloji geliştikçe Lexi'nin öncü olmasını umuyoruz” dedi. Zayıflatıcı felç, boğaz kanseri veya nörojeneratif hastalıkları olan milyonlarca insanın fayda sağlayabileceğini söyledi.

Pilot proje üzerinde çalışan bir diğer asistan Dr. Fatima Mirza, “Risklerin bilincinde olmalıyız ancak hastayı ve toplumsal faydayı unutamayız” dedi. “Lexi'ye gerçek sesini geri verme konusunda yardımcı olabiliyoruz ve kendisi için en doğru ifadelerle konuşabiliyor.”

Evli olan Mirza ve Ali, hastalar için tıbbi onam formlarını basitleştirmek amacıyla AI chatbot'u kullanan Lifespan'daki önceki araştırma projeleri nedeniyle ChatGPT yapımcısı OpenAI'nin dikkatini çekti. San Francisco şirketi, bu yılın başlarında yeni yapay zeka ses oluşturucusu için gelecek vaat eden tıbbi uygulamalar arayışındayken iletişime geçti.

Bogan ameliyattan sonra hâlâ yavaş yavaş iyileşiyordu. Hastalık geçen yaz baş ağrıları, bulanık görme ve sarkık bir yüzle başladı ve Providence'taki Hasbro Çocuk Hastanesi doktorlarını alarma geçirdi. Beyin sapına baskı yapan, kan damarlarına ve kafatası sinirlerine dolaşmış, golf topu büyüklüğünde bir damar tümörü keşfettiler.

Pediatrik beyin cerrahı Dr. Konstantina Svokos, “Kanamayı kontrol altına almak ve tümörü çıkarmak bir savaştı” dedi.

Svokos, ameliyatın 10 saat sürmesi, tümörün konumu ve ciddiyeti ile birlikte Bogan'ın dil kaslarına ve ses tellerine zarar vererek yemek yeme ve konuşma yeteneğini engellediğini söyledi.

Bogan, “Sesimi kaybettiğimde neredeyse kimliğimin bir parçası alınmış gibi” dedi.

Bu sene besleme tüpü çıktı. Konuşma terapisi devam ediyor ve sessiz bir odada anlaşılır bir şekilde konuşabilmesini sağlıyor ancak doğal sesinin tam berraklığına kavuşacağına dair hiçbir işaret yok.

Bogan, “Bir noktada sesimin neye benzediğini unutmaya başlıyordum” dedi. “Artık sesimin nasıl çıktığına o kadar alıştım ki.”

Ailenin North Smithfield banliyösündeki evinde telefon çaldığında, aramalarını cevaplaması için telefonu annesine veriyordu. Gürültülü bir restorana gittiklerinde arkadaşlarına yük olduğunu hissediyordu. İşitme kaybı olan babası onu anlamakta zorluk çekiyordu.

Hastanede doktorlar OpenAI teknolojisini deneyecek bir pilot hasta arıyorlardı.

Ali, “Dr. Svokos'un aklına ilk gelen kişi Lexi'ydi” dedi. “Yanıtının ne olacağını bilmeden ilgilenip ilgilenmeyeceğini öğrenmek için Lexi'ye ulaştık. Bunu denemek ve nasıl işe yarayacağını görmek için hazırdı.”

Bogan'ın, yapay zeka sistemini nasıl konuştuğu konusunda “eğitmek” amacıyla sesinin uygun bir kaydını bulmak için birkaç yıl öncesine gitmesi gerekti. Makarna salatasının nasıl yapıldığını anlattığı bir videoydu.

Doktorları yapay zeka sistemini kasıtlı olarak yalnızca 15 saniyelik bir kliple besledi. Yemek pişirme sesleri videonun diğer kısımlarını kusurlu hale getirir. Aynı zamanda OpenAI'nin ihtiyaç duyduğu tek şey de buydu; çok daha uzun numuneler gerektiren önceki teknolojiye göre bir gelişme.

Ayrıca, 15 saniye içinde faydalı bir şey elde etmenin, internette kendi seslerinden hiçbir iz bulunmayan gelecekteki hastalar için hayati önem taşıyabileceğini de biliyorlardı. Bir akrabaya bırakılan kısa bir sesli mesaj yeterli olabilir.

İlk kez test ettiklerinde herkes ses klonunun kalitesi karşısında şaşkına döndü. Ara sıra yaşanan aksaklıklar (yanlış telaffuz edilen bir kelime, eksik bir tonlama) çoğunlukla fark edilmiyordu. Nisan ayında doktorlar Bogan'a yalnızca kendisinin kullanabileceği özel yapım bir telefon uygulaması donattı.

Annesi Pamela Bogan gözlerinde yaşlarla, “Onun sesini her duyduğumda çok duygulanıyorum” dedi.

Lexi Bogan, “Bence bu sese tekrar sahip olabilmem harika bir şey” dedi ve bunun “güvenimi bir şekilde tüm bunlar olmadan önceki haline getirmesine yardımcı olduğunu” söyledi.

Artık uygulamayı günde yaklaşık 40 kez kullanıyor ve gelecekteki hastalara yardımcı olacağını umduğu geri bildirimleri gönderiyor. İlk deneylerinden biri, öğretmen asistanı olarak çalıştığı anaokulundaki çocuklarla konuşmaktı. Robotik bir yanıt bekleyerek “ha ha ha ha” yazdı. Şaşırtıcı bir şekilde, sesi eski gülüşüne benziyordu.

Bunu Target ve Marshall's'ta eşyaları nerede bulacağını sormak için kullandı. Babasıyla yeniden bağlantı kurmasına yardımcı oldu. Ve fast food sipariş etmesini kolaylaştırdı.

Bogan'ın doktorları diğer istekli Rhode Island hastalarının seslerini klonlamaya başladı ve teknolojiyi dünya çapındaki hastanelere getirmeyi umuyorlar. OpenAI, henüz halka açık olmayan Voice Engine'in kullanımını genişletme konusunda temkinli davrandığını söyledi.

Bir dizi küçük yapay zeka girişimi halihazırda eğlence stüdyolarına ses klonlama hizmetleri satıyor veya bunları daha geniş çapta kullanılabilir hale getiriyor. Çoğu ses oluşturma sağlayıcısı, kimliğe bürünme veya kötüye kullanımı yasakladıklarını söylüyor ancak kullanım koşullarını uygulama şekilleri farklılık gösteriyor.

OpenAI'nin ürün lideri Jeff Harris, “Hizmette sesi kullanılan herkesin sürekli olarak rıza gösterdiğinden emin olmak istiyoruz” dedi. “Siyasi bağlamlarda kullanılmadığından emin olmak istiyoruz. Bu nedenle teknolojiyi kime verdiğimiz konusunda çok sınırlı olma yaklaşımını benimsedik.”

Harris, OpenAI'nin bir sonraki adımının, kullanıcıların yalnızca kendi seslerini kopyalayabilmeleri için güvenli bir “sesli kimlik doğrulama” aracı geliştirmeyi içerdiğini söyledi. Bunun “Lexi gibi konuşma yeteneklerini ani bir şekilde kaybeden bir hasta için sınırlayıcı” olabileceğini söyledi. “Dolayısıyla teknolojiye biraz daha sınırsız erişim sağlamak için özellikle tıbbi sağlayıcılarla yüksek güvene sahip ilişkiler kurmamız gerektiğini düşünüyoruz.”

FOX HABER UYGULAMASINA ULAŞMAK İÇİN TIKLAYIN

Bogan, teknolojinin benzer veya daha ciddi konuşma engeli olan diğer kişilere nasıl yardımcı olabileceği konusundaki düşünceleriyle doktorlarını etkiledi.

Mirza, “Bütün bu süreç boyunca yaptığı şeylerden biri de bunu düzeltmenin ve değiştirmenin yollarını düşünmekti” dedi. “O bizim için büyük bir ilham kaynağı oldu.”

Şimdilik ses motorunu konuşturmak için telefonuyla uğraşmak zorunda olsa da Bogan, insan vücuduyla birleşerek konuşmayı iyileştirmeye yönelik eski tedavileri (robot ses çıkaran elektrolarenks veya ses protezi gibi) geliştiren bir yapay zeka ses motorunun hayalini kuruyor. veya kelimeleri gerçek zamanlı olarak çevirmek.

Yaşlandıkça ve yapay zeka sesi gençliğinde olduğu gibi çıkmaya devam ettikçe ne olacağı konusunda daha az emin oluyor. Belki teknoloji onun yapay zeka sesini “yaşlandırabilir” dedi.

Şimdilik, “Sesimi tam olarak geri alamasam da sesimi yeniden bulmama yardımcı olacak bir şeye sahibim” dedi.