Како функционишу апликације за превод говора мачака?

Како функционишу апликације за превод говора мачака?

Вероватно сте видели апликације које тврде да преводе оно што ваша мачка говори. Али могу ли заиста превести мијаукање ваше мачке на енглески? Кратак одговор је да, некако. Тешко је због јединствености „језика“ сваке мачке, али се могу прилично приближити савременом технологијом.





Мачје апликације за превођење попут МеовТалк -а користе облик препознавања говора који наглашава машинско учење. Погледајмо ближе.





Препознавање говора и машинско учење

Мари Тхереса МцЛеан/ Пикабаи





Препознавање говора функционише тако што снима говор и претвара звук у датотеку дигиталних података. Он кодира податке као што су висина и јачина звука као тачке података које апликација може анализирати и ускладити са значењима. ДПА микрофони објашњава да ове тачке података могу изгледати веома различито у зависности од позадинских звукова и начина изговора речи.

Понекад препознавање гласа узимамо здраво за готово, али то је невероватан подвиг технологије. Посебно с обзиром на то колико је људски говор сложен. Као Научник објашњава, свака реч укључује широк спектар звукова или 'фонема' уклопљених један у други. Рачунар да разуме говор је веома тежак. Нова граница звукова мачака биће још тежа.



Апликације које користе препознавање говора програмиране су „вокабуларом“ речи које се називају скупови података. Апликација затим усклађује ваш говор са најближом опцијом у свом речнику података.

Када направи грешку, исправите је и они сачувају те податке за следећи пут. Ово је део машинског учења. Тако програм учи да препознаје говор чак и када није идентичан скупу података са којим је започео.





Повезано: Шта су алгоритми машинског учења? Ево како они раде

Препознавање гласа и даље има проблема, посебно са говорним сметњама и акцентима. Неке компаније побољшавају машинско учење како би превазишле ове проблеме. Временом, машинско учење може препознавање говора претворити у моћно оруђе.





преместите податке апликације на СД картицу

Тако препознавање говора функционише код људи. Али да ли ради за мачке?

Препознавање говора насупрот препознавању мјаука

Ариана Суарез / Унспласх

Прво, морамо схватити зашто се превођење одређене врсте мијаука као „гладан сам“ разликује од анализе људског говора. Проблем је углавном у томе што се комуникација мачака више ослања на невербалне знакове попут држања. Други проблем је одсуство универзалног 'језика мачака'.

Према АСПЦА , одрасле дивље мачке никада не мијауче једна на другу, само на људима. Друга истраживања аутора хуманог друштва додаје да се ти звуци 'не појављују у вакууму'. Морамо их тумачити поред говора тела и других контекста. У многим случајевима, тихи сигнали су једина разлика између мијаука који значи „гладан сам“ и оног који значи „желим да се играм“.

Додатно, овом проблему не постоје две мачке које имају исти језик. Мачке развијају прилагођене „језике“ за своје власнике. Оне се делимично заснивају на имитацији гласа власника, а делимично на личности мачке. Не постоје две мачке које звуче исто, чак и када преносе исту жељу или потребу. Па како се речник говора једне апликације може превести за све њих?

Флексибилно машинско учење за мачке

Бесплатно коришћење звукова/ Унспласх

Иако се неколицини виртуелних помоћника свиђа Ауто покушај разумевања тона и емоција, препознавање говора је и даље ужасно на невербалне сигнале. Али то не значи да их је немогуће тумачити.

апликацију која вам омогућава да користите школски ВиФи

МеовТалк користи флексибилнију врсту машинског учења како би помогао у превазилажењу ових проблема.

Преузимање: МеовТалк фор Андроид | иос (Бесплатно)

Меовталк је креирао Јавиер Санцхез, који је такође радио у Алека тиму. Замишљао је апликацију као корак ка паметним огрлицама. Ове огрлице преводиле би звукове мачака у људски говор, ослањајући се на сложене стратегије машинског учења како би помогле људима да боље разумеју и брину о својим мачкама.

Тим МеовТалк надокнадио је проблеме јединствености стварањем специфичнијих профила за сваку мачку. У апликацији сваку мачку региструјете засебно. Сциенце Норваи извештава да мачићи мјаучу другачије од одраслих мачака, па апликација тражи и мачин рођендан. Сваки профил генерише јединствену мрежу података за мачку, укључујући мало дубоког учења у машинско учење.

Повезано: Дубоко учење против машинског учења против АИ: Како иду заједно?

За вокабулар, МеовТалк почиње са 10 звучних профила у свом скупу података. Сваки од њих има другачије значење, попут „срећан“ или „лов“. Када апликација чује звук и погреши, можете га исправити или створити ново тумачење.

Подаци ЦАТСОУНДС прикупљени из Аквелон

Исправљањем се каже апликацији да замени основни речник новим звуком.

како да пратите приватну историју прегледања

На пример, апликацији можете рећи да се подудара са „Ловом“ са кратким цвркутом уместо са дугим звиждуком. Ова врста корекције је кориснија од додавања више звукова који одговарају једном, што значи начин на који препознавање говора ради, што би било као да кажете апликацији да дуго викање и кратко цвркутање обоје значи 'Мајка Зови.'

Машинско учење у апликацијама за препознавање говора обично се опире овој врсти преписивања. То би било као да покушате научити Сири да када кажете 'технолошки блог', заиста мислите на 'крушку'. Али флексибилнији облик машинског учења који МеовТалк користи може лакше да реши ову исправку.

Креирање новог тумачења додаје значење које претходно није кодирано. На пример, ако ваша мачка има одређени позив када жели своју омиљену играчку, можете додати „Желим свог миша“ као опцију. Слично је додавању речи у речник за аутоматско исправљање.

Повезан: Како да дефинишете сопствене речи за аутоматско исправљање на Андроиду

Временом можете развити високо персонализовани профил говора за своју мачку. На крају би могло бити чак и довољно софистицирано да буде корисно за чуваре кућних љубимаца или за решавање проблема у понашању. Ако ништа друго, помаже власницима мачака да постану пажљивији према својим љубимцима.

Пресуда: Да ли апликације за превођење мачака раде?

На крају, „мачји превод“ се и даље много ослања на корисника који апликацију подучава како њихова мачка прича. То ће вероватно увек бити случај због јединствености комуникације сваке мачке.

Али чињеница да је машинско учење толико далеко да програмери могу чак и делимично успети у томе је невероватна. Машинско учење и вештачка интелигенција напредују невероватном брзином и једва чекамо да видимо куда иду.

Објави Објави Твеет Емаил Повезане теме
  • Објашњена технологија
  • Учење језика
  • Машинско учење
О аутору Наталие Стеварт(47 објављених чланака)

Наталие Стеварт је писац за МакеУсеОф. Прво се заинтересовала за технологију на факултету и развила страст према писању медија на универзитету. Наталие се фокусира на технологију која је доступна и лака за коришћење, а она воли апликације и уређаје који свакодневним људима поједностављују живот.

Више од Наталие Стеварт

Претплатите се на наш билтен

Придружите се нашем билтену за техничке савете, критике, бесплатне е -књиге и ексклузивне понуде!

Кликните овде да бисте се претплатили