La Révolution de l'Interprétation Multilingue: Comment Ça Marche?
By MattVidPro AI · 2024-03-21
Découvrez comment la technologie de l'IA révolutionne l'interprétation multilingue en temps réel. Comment fonctionne cette avancée incroyable?
La révolution de l'interprétation multilingue en temps réel par Meta AI
- Messieurs, il s'agit de l'un de ces moments dans le domaine de la technologie de l'IA où l'on découvre quelque chose rendu possible par l'IA qui relève presque de la magie. Aujourd'hui, nous allons jeter un coup d'œil à une recherche et une démonstration que vous pouvez essayer gratuitement grâce à Meta AI, oui, c'est Facebook. Il s'agit d'une communication en temps réel et transparente entre les langues. Ce qui va se produire ici, c'est que ma voix en anglais sera convertie en une autre langue presque en temps réel. Il s'agit d'un moment crucial où la technologie de l'IA, en apparence magique, commence à faire tomber les barrières linguistiques. Pendant que vous regardez la vidéo d'aujourd'hui, je veux que vous imaginiez une petite paire d'écouteurs que vous porteriez dans un autre pays. Vous parleriez votre langue maternelle et un haut-parleur quelque part retransmettrait votre voix traduite dans cette langue. L'appareil pourrait également capter la parole de quelqu'un d'autre dans sa langue maternelle, la traduire dans la vôtre et la diffuser dans vos oreilles, car c'est exactement ce que nous observons se dérouler en temps réel ici. Nous voici donc, messieurs, avec la recherche en intelligence artificielle, fluide et transparente, par Meta. Vous pouvez vraiment télécharger ces modèles, je tiens à le souligner clairement, regardez juste sur GitHub. Alors, même si vous pouvez télécharger, installer et utiliser ces modèles pour une communication transparente, cela n'est pas encore disponible pour un usage non commercial. Vous ne pouvez pas réellement construire de produits avec, cependant, ils sont entièrement ouverts à des fins de recherche et vous pouvez les redistribuer à des fins de recherche. C'est un peu où nous en sommes là-dessus. Je suis sûr qu'ils ouvriront probablement une grande partie de ces choses à un moment donné dans le futur. Si vous voulez en savoir plus, ils ont des informations de licence en bas. Mais oui, c'est beaucoup mieux que des choses entièrement fermées, c'est encore assez ouvert et c'est un bon signe. Avec le bon historique de Facebook en matière de publication de logiciels en open source, nous pouvons espérer voir cela complètement ouvert dans un avenir proche. Ils ont une petite introduction, donc regardons cela. Nous collaborons avec la communauté de l'IA pour aider à supprimer les barrières linguistiques et encourager une communication ouverte et authentique. Nous sommes ravis de présenter une série de nouveaux modèles : seamless M4t V2, une version améliorée de notre modèle fondamental, seamless expressive, qui préserve l'expression à travers les langues, seamless streaming, qui traduit la parole et le texte en moins de 2 secondes de latence, et enfin seamless, notre modèle unifié qui combine les capacités des trois. Notre modèle amélioré, seamless M4t V2, sert de base à un nouveau modèle seamless expressive et seamless stream. Ensuite, dans notre famille de modèles, nous avons le modèle expressive qui préserve les subtilités de la parole telles que les pauses, le débit de parole, l'accent mis sur certains mots, ainsi que le style vocal et l'intonation émotionnelle. Nous croyons qu'il est impératif que nos traductions non seulement transmettent avec précision les mots que nous disons, mais capturent également les subtilités de l'expression humaine. Veuillez baisser le volume, nous venons de coucher le bébé. Nous sommes également ravis de partager le streaming transparent, avec une latence de moins de 2 secondes, c'est le premier modèle massivement multilingue capable de traduire la parole et le texte en quasi temps réel. Imaginez-vous dans une situation sociale où la langue parlée vous est étrangère, puis imaginez pouvoir non seulement suivre la conversation...
La révolution de l'interprétation multilingue en temps réel par Meta AI
L'avenir de la traduction vocale expressive avec une technologie de pointe
- Avec un très faible délai mais aussi la capacité de traduire de manière transparente ce que vous voulez dire dans cette langue, nous pouvons maintenant avancer vers cette idée même que nous croyons être une autre avancée dans un voyage vers un monde plus connecté et nous attendons avec impatience les façons innovantes dont la communauté de l'IA va construire sur ce travail. Eh bien, d'accord alors, non seulement cela va capturer les parties expressives de ma voix, mais apparemment cela va capturer le ton général bien sûr, le clonage même de ma propre voix et tout cela avec une latence quasi en temps réel de moins de 2 secondes de retard, ce qui est certainement suffisant pour être utilisable dans le monde réel comme je l'ai dit, ils ont une démo gratuite, regardons ça. Seamless Expressive est un modèle d'IA qui vise à maintenir les éléments de style de discours expressif dans la traduction. Nous avons également le ton de votre voix ainsi que le volume, le ton qu'il soit excité, triste ou que vous chuchotiez, bien sûr le style de discours, donc la vitesse à laquelle je parle et si je fais une pause. Ils ont quelques exemples ci-dessous, donc heureux que vous soyez là, je suis tellement heureux de vous voir, wow, c'est bon mec. Wow, ça ressemble vraiment à sa voix, le clonage n'est peut-être pas aussi parfait que nous l'espérions. Deux secondes de latence les gars, dépêchez-vous, nous devons être là dans cinq minutes. Wow, c'est tellement bon, c'est encore plus incroyable de l'entendre en anglais mec. D'accord, je suis tellement excité d'essayer ça, tous ceux d'entre vous qui sont multilingues devez m'aider dans les commentaires en me disant quelles démos fonctionnent mieux et lesquelles ne sont pas aussi bonnes. J'ai vraiment besoin de votre aide, s'il vous plaît ne partez pas, je ne veux pas rester seul ici. Wow mec, c'est tellement bien maintenant chuchoter, baisser le volume, bébé vient de s'endormir, c'est tellement bien mec, c'est si utilisable. Oh, je suis tellement excité que les barrières linguistiques soient simplement abolies, tout le monde peut communiquer et ça a du sens. Bon, évidemment, je vais parler en anglais, nous allons traduire d'abord en espagnol, actuellement ils n'ont que ces langues dans cette démo, cependant je crois qu'il y a beaucoup plus de langues à choisir dans le code réel. Donc nous allons traduire en espagnol. Encore une fois, toutes les personnes hispanophones ici vont devoir m'aider dans les commentaires. Eh bien, nous chargeons la caméra aujourd'hui, d'accord pour une raison quelconque ils insistent pour avoir la caméra aussi donc j'ai ma webcam, les deux Matts peuvent se regarder. D'accord, c'est un peu étrange mais essayons. Dis : Excité. Il veut que je dise ce texte spécifique mais je ne vais pas le faire. Abonnez-vous à la chaîne YouTube de Matt VidPro IA. C'était la traduction expressive en espagnol mec, c'est incroyable, avez-vous entendu la façon dont il a dit Matt VidPro, j'adore ça. Abonnez-vous à la chaîne YouTube de Matt VidPro IA, ouais d'accord, ça ne ressemble pas exactement à ma voix mais c'est tellement bien et c'est sûrement très expressif, vous pouvez l'entendre même si je ne parle pas espagnol, je sais évidemment ce qu'il est censé dire et je peux entendre l'expression là-dedans. C'est la traduction non expressive, pour le contexte, je veux dire que c'est juste un robot, nous ne voulons pas ça, non. Je ne peux pas m'en remettre, c'est tellement cool, oh partagez votre traduction en espagnol avec vos amis et votre famille, c'est cool. C'est pourquoi ils ont la vidéo ici. Abonnez-vous à la chaîne YouTube de Matt VidPro IA. D'accord, je comprends maintenant, je vois pourquoi la webcam était là. Je vous suggère de partager certaines de ces vidéos.
L'avenir de la traduction vocale expressive avec une technologie de pointe
La Puissance de la Réécriture avec l'IA: Expérimentation et Exploration
- Essayez-le par vous-même, j'aimerais voir comment différentes personnes réagissent. Vous pouvez me contacter sur mon serveur Discord et partager les opinions de différentes personnes à ce sujet. Je veux savoir à quel point les traductions sont bonnes. Pour l'instant, nous allons nous en tenir à l'anglais et à l'espagnol, puis nous passerons à l'allemand et au français. Essayons la traduction rapide maintenant. Pouvez-vous m'acheter de la crème glacée, s'il vous plaît? J'ai très faim de crème glacée. Achetez-moi de la crème glacée tout de suite, sinon je vais vraiment être triste et je vais pleurer par terre. J'ai vraiment très envie de crème glacée. Allez-y. Voici l'extrait original : Pouvez-vous m'acheter de la crème glacée, s'il vous plaît? J'ai très faim de crème glacée. Achetez-moi de la crème glacée tout de suite, sinon je vais vraiment être triste et je vais pleurer par terre. J'ai vraiment très envie de crème glacée. Pensez-vous que cela va être un peu difficile? Dites-moi à quel point c'était bon, s'il vous plaît. A-t-il mal traduit des mots? Est-ce que cela semble qu'il parle très rapidement? Pour moi, cela semble certainement le cas. Voulons-nous même écouter la version non expressive? On peut même voir que la version non expressive dure 11 secondes, alors que l'extrait original durait neuf secondes et la traduction expressive dure 10 secondes. Pouvez-vous m'acheter de la crème glacée, s'il vous plaît? J'ai très faim de crème glacée. Achetez-moi de la crème glacée tout de suite, sinon je vais vraiment être triste et je vais pleurer par terre. J'ai vraiment très envie de crème glacée. D'accord, j'adore ce genre de choses. D'accord, je dois vraiment essayer ceci en chuchotant. Je vais essayer d'utiliser des mots que je connais en espagnol pour avoir une meilleure idée. Chien, chien, chien. Chat, chat. Maison. D'accord, c'était assez bas. Chien, chien, chien. Je n'aime pas chuchoter. Oh mon Dieu. Le chuchotement fonctionne vraiment très bien, aussi déteste que je sois à l'écoute de chuchotements, je dois réessayer maintenant. Maintenant que je vous ai enfermé dans ma cave, je peux vous obliger à regarder sans fin le contenu de l'IA Matt vidpro jusqu'à ce que vous ne puissiez plus le regarder. D'accord, je n'essayais pas d'être effrayant, les gars. Pourquoi est-ce tellement plus effrayant en espagnol? Je ne peux pas croire à quel point le chuchotement fonctionne bien. Je ne pensais pas que cela allait tellement m'époustoufler, mais c'est totalement le cas. Vous voulez entendre un secret? La chaîne IA Matt vidpro vous bénira avec cinq ans de bonne chance si vous appuyez simplement sur le bouton J'aime sur cette vidéo. D'accord, j'étais un peu plus proche du microphone pour celui-ci. Faites-moi savoir si la traduction est bonne. Un peu plus de rauquerie sur celui-là, mais pour être honnête, ma voix chuchotée originale était assez rauque aussi. La traduction non expressive est juste inutile, sortez-la d'ici. D'accord, je veux essayer la tristesse et je vais aussi essayer des émotions qui ne sont pas répertoriées ici. Je veux voir à quel point cela fonctionne avec celles-ci. Oh mon Dieu, vous vous êtes désabonné de Matt vidpro AI, qu'est-ce qui ne va pas chez vous? Je pleure en ce moment, c'est la chose la plus triste jamais vue. Wow. Oh mon Dieu, il a l'air vraiment très triste. Il est un peu plus robotique que les autres, je pense, mais il a l'air sur le point de pleurer. D'accord, essayons une émotion qui n'est même pas répertoriée dans leur démo. Essayons la colère. Es-tu sérieux là? Tu ne m'as pas acheté un seul citron pour Noël, tu sais que c'est mon fruit préféré. Qu'est-ce qui ne va pas chez toi? J'essaie vraiment de pousser ce modèle expressif à ses limites. Celui-ci va être difficile pour le modèle. Cela fonctionne mieux que je ne pensais. Vous, qui parlez espagnol, devrez me le dire, mais pour moi au moins...
La Puissance de la Réécriture avec l'IA: Expérimentation et Exploration
La puissance de la langue française dans la recréation de la voix
- Quelle expérience enrichissante que de tester sa capacité à chanter, à explorer de nouvelles voies vocales. D'une douceur inattendue, le chant révèle des nuances insoupçonnées. Passons maintenant au français. Je parle français maintenant. Matt vidpro peut réellement parler français pleinement. J'ai toujours su parler cette langue. Ces vidéos me plaisent énormément. Le clonage vocal est impressionnant, traduisant avec précision les expressions et le texte en un clin d'œil. Incroyable! L'émotion m'envahit. L'intelligence artificielle a conquis le monde, emportant avec elle mes proches. Une intrusion dans l'intimité. Le français sonne parfaitement naturel, presque comme ma propre voix. Passons à l'allemand. Enfin, l'intensité de la colère. Les limites du modèle sont mises à l'épreuve. Une exploration fascinante de la voix. Excitant, n'est-ce pas?
La puissance de la langue française dans la recréation de la voix
La magie de la traduction automatique: une expérience linguistique passionnante
- Se désabonner de la chaîne Matt vidpro ? Non, s'il vous plaît, je ne le pensais pas, ne vous désabonnez pas. Vous pouvez détester mes décorations, mais ne vous désabonnez pas de la chaîne Matt vidéo BR. Il y a eu un réel échec dans la traduction, elle a juste fait de l'anglais en anglais, donc il y a clairement un petit problème ici qu'ils doivent corriger. Apparemment, cela fonctionne la plupart du temps, cela ne semble pas se produire si souvent, mais oui, cela a mis comme un léger accent allemand sur ma voix. Bon, maintenant, je veux essayer l'espagnol vers l'anglais. Je ne parle pas espagnol, mais je vais essayer de lire quelques mots espagnols et voir comment ils se traduisent en anglais. Po, po, po, gate, gate, gate, Kasa, Casa, Casa, oui, ce sont les trois mots espagnols que je connais. Ne me blâmez pas pour cela. Chat phonétique, traduction GPT, et voyons à quel point je peux être proche. Non, j'ai bousillé ça. Ad, ad, je ne pense pas que je parle bien espagnol, désolé, les gars. Essayons juste de lire l'espagnol correctement. Hé, salut tout le monde, je suis accro à la technologie cool, c'est parti. D'accord, je dois juste lire le texte espagnol, ça a marché beaucoup mieux. Mon Dieu, ce gars ne sait pas parler espagnol pour sauver sa vie. Oui mec, oh mon Dieu, je ne sais pas pourquoi ça me rend si excité. Cela ressemble à moi, cela nous donne une meilleure idée de la traduction, car nous traduisons en anglais. Mon Dieu, ce gars ne sait pas parler espagnol pour sauver sa vie, quelle bonne traduction aussi. Je veux essayer l'allemand, désolé d'avance. Ce que je lisais là, c'était ce qui était sur la démo de Meta. Vous êtes en train de lire, je suis tellement content de vous voir tous. D'accord, nous y sommes, mec, ver, der, c, jet, zo, spirit, hat, n, al, d'accord, je n'ai même pas pu aller jusqu'au bout, ce gars fait des acrobaties, il n'a pas tout. En fait, j'étais plutôt bon, apparemment mon discours en allemand est assez bon pour que ça fonctionne. Je pense que ma phrase était un peu trop longue, cela ressemblait vraiment à moi pourtant. J'aime essayer l'anglais et d'autres langues, c'est durat ce type est chaud, whoa, d'accord, donc dire que ce serait le summun, cela signifie juste ce type est chaud, ouais, tant pis, essayons aussi le français. La technologie nous change notre monde, je suis vraiment impressionné par sa capacité à comprendre mes affreuses langues différentes. Je ne parle pas du tout les langues, c'est probablement l'accent américain le plus épais que vous ayez jamais entendu. Lien de Matt vid Pro, moi le Matt vid Pro Channel, mon destin, je ne sais pas, je ne m'en rapproche pas. C'est la démo qu'ils ont, bien sûr, ils ont aussi ces autres modèles, mais ceux-ci ne sont pas présentés sur le site. Si vous voulez utiliser les autres modèles, vous devrez les télécharger sur GitHub. Je veux dire, c'est un véritable choc, les gars, celui-là m'a vraiment bluffé. C'est l'un de ces rares moments où j'ai, enfin ces derniers temps pas si rares, mais c'est l'un de ces produits basés sur l'IA qui me stupéfient vraiment. C'était tellement amusant, je vous recommande vraiment d'essayer vous-même. Encore une fois, donnez-moi votre avis si vous parlez l'une de ces langues, partagez vos meilleurs résultats dans le serveur Discord. Merci beaucoup de m'avoir suivi et je vous dis à la prochaine. Au revoir.
La magie de la traduction automatique: une expérience linguistique passionnante
Conclusion:
La révolution de l'interprétation multilingue en temps réel par Meta AI ouvre de nouvelles possibilités pour une communication fluide entre les langues. Explorez cette technologie incroyable et découvrez comment elle rapproche les gens du monde entier.