Kaip televizorių geriau suprasti

„Kokio kvailumo yra rinkėjai, kokie jie avinai“ - Aušra Maldeikienė || Laikykitės ten pokalbiai (Birželis 2019).

Anonim

Nauji "Waterloo" universiteto tyrimai nustatė būdą pagerinti namų pramogų platformų balso užklausų supratimo galimybes.

Tyrimas, bendradarbiaujant su Merilendo universitetu ir "Comcast Applied AI Research Lab", naudojasi dirbtinio intelekto (AI) technologija, kad iki šiol pasiektų natūraliausią kalbos sąveiką su televizoriais.

"Šiandien mes pripratėję kalbėtis su protingais agentais, kurie vykdo mūsų siūlymus - nuo" Siri "mobiliuoju telefonu" Alexa "namuose. Kodėl neturėtume galėti padaryti tą patį ir su televizoriais?" paklausė Jimmy Linas, Vaterlo universiteto profesorius ir David R. Cheriton kompiuterių mokslo mokyklos pirmininkas David R. Cheriton.

"Comcast" "Xfinity X1" siekia tai padaryti tiksliai - platforma turi "balso nuotolinį", kuris priima žodines užduotis. Jūsų noras yra jo komanda - pasakykite savo televizoriui, kad galėtumėte keisti kanalus, paklausti apie nemokamus vaikų filmus ir net apie orus prognozė. "

Spręsdama sudėtingą balso užklausų supratimo problemą, mokslininkai turėjo mintis pasinaudoti naujausia AI technologija - technika, vadinama hierarchiniais kartojamaisiais neuroniniais tinklais - geriau suplanuoti kontekstą ir tobulinti sistemos tikslumą.

2018 m. Sausio mėn. Mokslininkų naujasis neuronų tinklo modelis buvo dislokuotas gamyboje, kad atsakytų į tikrų gyvų naudotojų užklausas. Skirtingai nuo ankstesnės sistemos, kurią supainiojo maždaug aštuoni procentai užklausų, naujasis modelis tinkamai vykdo daugumą labai sudėtingų užklausų, labai padidindamas naudotojų patirtį.

"Jei žiūrovas prašo" Chicago Fire ", kuris reiškia tiek dramos seriją, tiek futbolo komandą, sistema gali iššifruoti tai, ko tikrai nori", - sakė Linas. "Tai, kas ypatinga apie šį požiūrį, yra tai, kad mes naudojame kontekstą, pavyzdžiui, anksčiau stebėtus įvykius ir mėgstamus kanalus, kad suasmeninti rezultatus, taip padidindami tikslumą."

Tyrėjai pradėjo dirbti dar turtingesnio modelio kūrimui. Intuicija yra tai, kad analizuojant klausimus iš daugybės perspektyvų, sistema gali geriau suprasti, ką žiūri sakau.

Popierius "Multi-Task Learning with Neural Networks for Voice Query" "Entertainment Platform" supratimas pristatytas 24-ojoje ACM SIGKDD tarptautinėje konferencijoje "Knowledge Discovery & Data Mining", vykusioje neseniai Jungtinėje Karalystėje. Tyrimą atliko Jinfeng Rao, Ph.D. baigė Merilendo universitetą, jo patarėją Liną ir mentorių Ferhaną Ture, Comcast Applied AI Research Lab tyrėją.

menu
menu