Root NationАхборХабарҳои ITAI нав Microsoft аз намунаи аудиоии 3 сония ба овози ягон шахс тақлид мекунад

AI нав Microsoft аз намунаи аудиоии 3 сония ба овози ягон шахс тақлид мекунад

-

Рӯзи панҷшанбе, муҳаққиқон Microsoft модели нави зеҳни сунъӣ (AI) -ро эълон кард, ки VALL-E ном дорад, ки ҳангоми додани намунаи аудиоии се сония метавонад овози инсонро дақиқ тақлид кунад. Вақте ки он овози мушаххасро меомӯзад, VALL-E метавонад аудиои он шахсро, ки ҳар чизе мегӯяд, синтез кунад ва оҳанги эмотсионалии баландгӯякро нигоҳ дорад.

Муаллифони он пешниҳод мекунанд, ки VALL-E-ро барои босифати матн ба сухан, таҳрири нутқ истифода бурдан мумкин аст, ки дар он сабти шахс метавонад аз транскрипсияи матн таҳрир ва тағир дода шавад (ба онҳо чизҳоеро, ки дар аввал нагуфтаанд) ва барои эҷоди мундариҷаи аудио дар якҷоягӣ бо дигар моделҳои тавлидкунандаи AI, ба монанди GPT-3.

Microsoft АИ ВАЛ-Е

Microsoft VALL-E-ро "Модели забони нейронӣ кодек" меномад ва он ба технологияе бо номи EnCodec асос ёфтааст, ки Meta моҳи октябри соли 2022 эълон кардааст. Баръакси усулҳои дигари матн ба нутқ, ки маъмулан нутқро тавассути коркарди шаклҳои мавҷ синтез мекунанд, VALL-E аудиои дискретиро тавлид мекунад. рамзҳои кодек аз дархостҳои матнӣ ва акустикӣ. Он асосан таҳлил мекунад, ки шахс чӣ гуна садо медиҳад, ин маълумотро ба ҷузъҳои дискретӣ (бо номи "токенҳо") тақсим мекунад, ба туфайли EnCodec ва маълумотҳои омӯзиширо барои мувофиқат кардани он чизе, ки "медонад" истифода мебарад, дар бораи он, ки ин овоз чӣ гуна садо медиҳад, агар он дар берун ибораҳои дигарро ифода кунад. аз намунаи се сония.

Microsoft қобилияти синтези нутқи VALL-E-ро дар китобхонаи аудиоие, ки аз ҷониби Meta бо номи LibriLight тартиб дода шудааст, омӯзонд. Он дорои 60 соат пахши забони англисӣ аз зиёда аз 7 дикторҳо мебошад, ки асосан аз китобҳои аудиоии дастраси LibriVox гирифта шудаанд.

Илова ба нигоҳ доштани тембри овоз ва оҳанги эмотсионалии диктор, VALL-E инчунин метавонад "муҳити акустикии" намунаи аудиоиро тақлид кунад. Масалан, агар намуна аз сӯҳбати телефонӣ гирифта шуда бошад, баромади аудиои синтезшуда хосиятҳои акустикӣ ва басомади сӯҳбати телефониро тақлид мекунад. Инчунин намунаҳо Microsoft нишон медиҳад, ки VALL-E метавонад вариантҳои тембрҳои овозиро тавлид кунад.

Microsoft АИ ВАЛ-Е

Шояд аз сабаби қобилияти VALL-E барои мусоидат ба қаллобӣ ва фиреб, Microsoft рамзи VALL-E-ро барои озмоиши дигарон пешниҳод накардааст, аз ин рӯ мо имкони санҷида наметавонем. Чунин ба назар мерасад, ки муҳаққиқон аз зарари иҷтимоии эҳтимолии ин технология огоҳанд. Дар хотимаи макола онхо чунин менависанд:

"Азбаски VALL-E метавонад нутқеро, ки шахсияти сухангӯро ҳифз мекунад, синтез кунад, он метавонад хатарҳои эҳтимолии сӯиистифодаи моделро, аз қабили қаллобӣ барои муайян кардани овоз ё тақлид кардани як сухангӯи мушаххас дошта бошад. Барои кам кардани чунин хатарҳо, модели шинохтан сохта мешавад, то фарқ кунад, ки оё клипи аудиоӣ бо истифода аз VALL-E синтез карда шудааст."

Шумо метавонед ба Украина дар мубориза бар зидди истилогарони рус кӯмак кунед. Роҳи беҳтарини иҷрои ин хайрия маблағ ба Қувваҳои Мусаллаҳи Украина мебошад Savelife ё тавассути саҳифаи расмӣ NBU.

Ҳамчунин хонед:

Сарчашмаарстехника
қайд кардан
Огоҳӣ дар бораи
меҳмон

0 Назарҳо
Баррасиҳои воридшуда
Ҳамаи шарҳҳоро бинед
Барои навсозиҳо обуна шавед