«Lielais brālis» drīz būs realitāte

TVNET
CopyLinkedIn Draugiem X
Lūdzu, ņemiet vērā, ka raksts ir vairāk nekā piecus gadus vecs un ir pārvietots uz mūsu arhīvu. Mēs neatjauninām arhīvu saturu, tāpēc var būt nepieciešams meklēt jaunākus avotus.
Foto: depositphotos.com

Kā zināms, Google jau sen vairs nav tikai interneta meklētājs. Kompānija gadu gaitā ir strauji augusi un tagad ir gan meklētājs, gan ziņu atlases algoritms, gan e-pasta pārvaldnieks, gan izstrādā automobiļus ar autopilotu un cita starpā nodarbojas arī ar mākslīgā intelekta attīstīšanu.

Google piederošais uzņēmums DeepMind, kas nodarbojas ar mākslīgā intelekta tēmu, sadarbībā ar Oksfordas universitāti ir izstrādājis līdz šim precīzāko programmatūru, kas prot lasīt no lūpām, raksta Theverge.com.

Izmantojot BBC videomateriālus tūkstošiem stundu garumā, zinātnieki mākslīgo intelektu iemācīja kādu videoierakstu anotēt ar 46,8 procentu precizitāti. Varbūt tas nešķiet ievērības cienīgi, zinot, cik labi tādiem rīkiem kā Google balss atpazīšanas programmai vai Apple Siri izdodas interpretēt un saprast runātu tekstu, tomēr patiesībā rezultāts ir iespaidīgs; galu galā profesionāls lasītājs no lūpām šajā pašā video precīzi atšifrēja vien 12,4% no izrunātajiem vārdiem.

Oksfordas universitāte novembra sākumā jau publicēja līdzīga izmēģinājuma rezultātus, un tajos programma, kas nodēvēta par LipNet, darbojās ar 93,4 procentu precizitāti, kamēr cilvēks spēja nolasīt vien 52,3% vārdu. Tiesa gan, toreiz testā tika izmantots speciāli sagatavots un lasīts teksts. Tādējādi DeepMind uzdevums ir krietni vien grūtāks, jo jāsaprot ikdienišķā situācijā, šajā gadījumā - BBC raidījumā par politiku - runāti vārdi.

DeepMind izstrādātā programma Watch, Listen, Attend, and Spell zināšanas guva, «noskatoties» video vairāk nekā 5000 stundu garumā. Šajos video kopumā bija 118 tūkstoši dažādu teikumu un apmēram 17 500 unikālu vārdu. Lipnet tikmēr izmantoja vien datu bāzi ar 51 vārdu.

Google mākslīgā intelekta nodaļas eksperti ir pārliecināti, ka Watch, Listen, Attend, and Spell var attīstīt tiktāl, lai palīdzētu cilvēkiem ar dzirdes traucējumiem, tulkotu mēmo kino vai lūgtu palīdzību tādiem rīkiem kā Siri, vienkārši virinot muti. Sabiedriskās vietās tas varētu būt noderīgi.

Vienlaikus šī tehnoloģija varētu palīdzēt spiegošanā, jo nav grūti iztēloties, ka to iespējams sajūgt ar pilsētās izvietotajām novērošanas kamerām.

KomentāriCopyLinkedIn Draugiem X
Svarīgākais
Uz augšu