ОпенАИ даје ЦхатГПТ-у глас да одговори на упите и команде

Читаоци попут вас помажу у подршци МУО. Када обавите куповину користећи везе на нашем сајту, можда ћемо зарадити провизију за партнере. Опширније.

ЦхатГПТ је постављен да постане интерактивно генеративно искуство вештачке интелигенције. ОпенАИ је открио да ће водећи светски АИ цхатбот моћи да говори и одговара на корисничке упите користећи синтетизовани глас, вероватно генерисан од вештачке интелигенције.

Заједно са својим новооткривеним гласом, ЦхатГПТ ће такође моћи да одговори и дискутује о одређеним сликама које су отпремљене на њега или снимљене док користите ЦхатГПТ Андроид или иОС апликацију. Функција препознавања слике звучи слично као Гоогле Ленс и друге апликације које користе неуронске мреже за прецизно откривање података и информација.

апликацију за проналажење одеће са слике

ОпенАИ даје глас ЦхатГПТ-у

25. септембра 2023, ЦхатГПТ програмер ОпенАИ открио то би дало глас свом водећем светском генеративном АИ цхатботу. Корисници ЦхатГПТ-а могу да разговарају директно са четботом и захтевају од њега да одговори, што ефективно омогућава ЦхатГПТ-у да по први пут разговара директно гласом.

ОпенАИ-јев пример клипа приказује жену која тражи од ЦхатГПТ-а да направи јединствену причу за спавање, на коју ЦхатГПТ прописно одговара женским синтетизованим гласом.

Према Виред , нови модел претварања текста у говор је развијен у компанији. Може да генерише 'људски' звук из текста и неколико секунди примера говора ( користећи ОпенАИ Вхиспер модел ) и говоре разним тоновима и стиловима. Можете пронаћи низ гласовних узорака на ОпенАИ блог .

Неке компаније већ користе ОпенАИ-ов нови гласовни модел. На пример, Спотифи користи ОпенАИ-ов модел претварања текста у говор за превођење подцаста на различите језике, комбинујући ЦхатГПТ-ову способност превођења језика са новом способношћу говора.

ЦхатГПТ-ов нови модел претварања текста у говор доступан је само претплатницима Плус и Ентерприсе који користе званичне Андроид и иОС апликације и очекује се да ће бити представљен у наредне две недеље (почев од 25. септембра 2023.). Штавише, нова гласовна функција је за почетак ограничена на енглески, мада бисмо очекивали да ће се ово брзо променити.

како гледати видео снимке са старосним ограничењем на ИоуТубе -у без пријављивања

ЦхатГПТ може да препозна и и фотографије

Други део ОпенАИ-овог ЦхатГПТ ажурирања је могућност анализе и разговора слика које су учитане у алатку. Опција визуелне анализе слике је представљена у видео снимцима за ажурирање ГПТ-4, али се од тада о њој није много расправљало ( Тумач кодова за ЦхатГПТ на страну ).

Сада ЦхатГПТ добија функционалност сличну Гоогле Ленс-у. Можете да отпремите слику на ЦхатГПТ или снимите фотографију помоћу камере паметног телефона у апликацији ЦхатГПТ, а она ће детаљније приказати слику, додајући више контекста где је то потребно.

Називање „слично Гоогле сочиву“ заиста чини неправду. Могућност ћаскања напред-назад о слици ради добијања више информација и контекста чини је изузетно корисним за широк спектар подешавања. Међутим, важно је напоменути ситно писмо, при чему је ОпенАИ јасно ставио до знања да има ограничену ЦхатГПТ-ову „способност да анализира и даје директне изјаве о људима“ из разлога приватности и тачности. Ипак, да ли би ОпенАИ-ов алат „Ко је ово“ могао бити у раду у будућности? (Надајмо се да не!)

Као и нови модел претварања текста у говор, ОпенАИ ће представити препознавање слика у наредне две недеље, иако ће бити доступно на свим платформама, не само у апликацији ЦхатГПТ.

Приватност, безбедност и друга питања

Импликације ЦхатГПТ-а са гласовним напајањем су оштре. Наравно, узбудљиво је. Међутим, могућност стварања јединствено синтетизованог гласа користећи само кратки исечак као пример има значајна питања приватности и безбедности. Потенцијал злонамерних актера да искористе ове алате је огроман, и као и код сваког генеративног АИ алата, када дух изађе из боце, он се апсолутно неће вратити унутра. Никаква регулација АИ од влада или вођа мисли не може вратити назад плима.

Чини се да чак и упозорење ОпенАИ-а на ову тему заобилази очигледно упркос помињању проблема:

Међутим, ове могућности представљају и нове ризике, као што је могућност да се злонамерни актери лажно представљају као јавне личности или почине превару. Због тога користимо ову технологију за покретање специфичног случаја употребе — гласовног ћаскања.
како копирати и залепити на МацБоок Аир

С обзиром да је ово врх леденог брега, очекујте одбијање новопронађеног гласа ЦхатГПТ-а, посебно када дође до предвидљивог пораста неугодних наслова који тврде да се ЦхатГПТ користи за вршење преваре и тако даље.

ОпенАИ претвара ЦхатГПТ у АИ апликацију

Што више ОпенАИ додаје функције прилагођене кориснику у ЦхатГПТ, то више постаје генеративна АИ апликација. Као први који је достигао широку славу током почетног бума генеративне вештачке интелигенције, ЦхатГПТ и даље води и једина је апликација коју неко користи, упркос конкуренцији попут Гоогле Барда (и потенцијално Гоогле Гемини) и Антхропиц'с Цлаудеа.

Све док ОпенАИ може да настави да додаје функције које олакшавају коришћење ЦхатГПТ-а, он ће људе држати привученима и све више приближавати свом циљу истински мултимодалног АИ алата.