ElevenLabs , la plataforma viral impulsada per IA per crear veus sintètiques, ha llançat avui la seva plataforma fora de la versió beta amb suport per a més de 30 idiomes.
Utilitzant un nou model d'IA desenvolupat internament, ElevenLabs diu que les seves eines ara són capaços d'identificar automàticament idiomes, inclosos el coreà, l'holandès i el vietnamita, i generar un discurs emocionalment ric en aquests idiomes.
En combinació amb el nou model, els clients d'ElevenLabs poden aprofitar l'eina de clonació de veu de la plataforma per parlar en els gairebé 30 idiomes sense haver d'escriure text abans.
programari espia de l'aplicació del sistema Android
ElevenLabs va començar amb el somni de fer que tot el contingut sigui universalment accessible en qualsevol idioma i amb qualsevol veu, va dir el CEO i cofundador d'ElevenLabs, Mati Staniszewski, en un comunicat. Amb aquest llançament, estem un pas més a prop de fer realitat aquest somni i de fer que veus d'IA de qualitat humana estiguin disponibles en tots els dialectes. Les nostres eines de generació de text a veu ajuden a igualar el terreny de joc i oferir capacitats d'àudio parlat de màxima qualitat a tots els creadors.
Fundat per Staniszewski, que abans treballava a Palantir, i el seu amic de la infància Piotr Dabkowski, un ex-empleat de Google, ElevenLabs ha estat als titulars dels darrers mesos per raons tant bo i repugnant . Inspirats pel doblatge mediocre de les pel·lícules nord-americanes que Staniszewski i Dabkowski van veure créixer a Polònia, la parella es va plantejar dissenyar una plataforma que pogués fer-ho millor, utilitzant IA, és clar.
ElevenLabs es va llançar en versió beta a finals de gener i va agafar força ràpidament, a causa de l'alta qualitat de les seves veus generades i del generós nivell gratuït. Però, com s'ha esmentat anteriorment, la publicitat no ha estat constantment positiva, sobretot quan els actors dolents van explotar la plataforma per als seus propis fins.
El famós tauler de missatges 4chan, conegut pel seu contingut conspiratiu, utilitzat Eines d'ElevenLabs per compartir missatges d'odi que imiten celebritats com l'actor Emma Watson. En altres llocs, James Vincent de The Verge va poder tocar ElevenLabs per clonar les veus dels objectius en qüestió de segons, generant mostres d'àudio que contenen tot, des d'amenaces de violència fins a expressions de racisme i transfòbia.
En resposta, ElevenLabs va dir que introduiria un conjunt de noves garanties, com ara limitar la clonació de veu als comptes de pagament i proporcionar una nova eina de detecció d'IA.
ElevenLabs encara ha de lluitar amb l'altra controvèrsia que s'està produint al voltant de la seva plataforma i altres plataformes semblants: la seva amenaça per a la indústria de la veu.
Placa base escriu sobre com se'ls demana cada cop més als actors de veu que cedeixin els drets de les seves veus perquè els clients puguin utilitzar la IA per generar versions sintètiques que eventualment podrien substituir-les. Mentrestant, correus electrònics interns vist de The New York Times indiquen que Activision Blizzard, un dels editors de jocs més grans del món, està treballant en eines per a la clonació de veu assistida per IA.
Sembla que ElevenLabs veu això com la progressió natural de les coses, promocionant el seu treball amb editors com Storytel; plataformes multimèdia com TheSoul Publishing i MNTN per a audiollibres i contingut radiofònic; i editorials com Embark Studios i Paradox Interactive per a videojocs, (Storytel i TheSoul Publishing són inversors estratègics). L'empresa afirma que té més d'un milió d'usuaris registrats als espais creatius, d'entreteniment i de publicació que han creat 10 anys de contingut d'àudio.
Apple adoptant rcs
ElevenLabs, que recentment va recaptar 19 milions de dòlars d'inversors, inclosos Andreessen Horowitz i el cofundador de DeepMind, Mustafa Suleyman, amb una valoració de 99 dòlars, té previst ampliar els seus models d'IA al doblatge de veu, seguint els passos de startups com Papercup i Deepdub i construint el que és. convoca una base per poder transferir emocions i entonació d'una llengua a una altra.
Més enllà d'això, ho diu ElevenLabsté previst introduir un mecanisme que permeti als usuaris compartir veus a la plataforma, tot i que els detalls segueixen sent borrosos.