• Wednesday July 17,2019

Rozmawiaj z gadżetami

Anonim

Dzięki uprzejmości AT & T

Twórcy gadżetów mobilnych napotykają pewien paradoks. Chcą stworzyć najpotężniejsze urządzenie, jakie tylko mogą, wciśnięte w najmniejsze pudełko. Ale aby urządzenie było użyteczne, ludzie muszą mieć możliwość interakcji ze wszystkimi jego funkcjami. Coraz więcej funkcji oznacza coraz więcej przycisków - a ludzie z uporem pozostają tej samej wielkości i kształtu. Przycisk może być tylko tak mały, zanim stanie się niemożliwy do naciśnięcia, co stanowi trudny limit dla miniaturyzacji. Różne urządzenia spotykają się z tym paradoksem na różne sposoby: przyciski klawiatury telefonu komórkowego rutynowo wykonują podwójne, potrójne, a nawet poczwórne obowiązki, podczas gdy urządzenia takie jak tablety korzystają z ekranów dotykowych i rozpoznawania gestów.

AT & T opracowuje kolejne rozwiązanie. Chce, abyś mógł po prostu rozmawiać z urządzeniem elektronicznym i zlecić wykonanie instrukcji. Podczas gdy niektóre telefony komórkowe już oferują rozpoznawanie głosu dla podstawowych zadań, takich jak wyszukiwanie numerów telefonów na liście kontaktów, AT & T przewiduje urządzenia, które mogą obsługiwać znacznie bardziej skomplikowane polecenia głosowe, takie jak "Powiedz mi, gdzie mogę znaleźć najbliższy bankomat" lub " Zamów mi pizzę pepperoni. "

Od dziesięcioleci AT & T pracuje nad systemem rozpoznawania głosu, który może obsłużyć właśnie takie żądania. Znany jako Watson, jest tak złożony, że bardziej praktyczne jest uruchamianie oprogramowania na scentralizowanych serwerach niż instalowanie, zarządzanie i utrzymywanie go na niezliczonych urządzeniach mobilnych. Na szczęście dzisiejsze urządzenia mobilne mają możliwość łączenia się z Internetem w piki. Dzięki włączeniu bardzo prostego sprzętu i oprogramowania do przechwytywania i kompresowania mowy (które telefony już posiadają), każde urządzenie może otrzymać dar rozpoznawania głosu. Przechwycona mowa jest wysyłana, przez Internet lub sieć komórkową, do komputerów AT & T z systemem Watson. Oprogramowanie Watson analizuje mowę i odsyła cyfrową odpowiedź, którą urządzenie może przetłumaczyć na polecenia. Aby zademonstrować tę zasadę, naukowcy AT & T zbudowali sterowany głosem pilot telewizyjny. Zaprojektowany do pracy z usługą telewizji internetowej AT & T, U-verse, pilot pozwala robić takie rzeczy, jak poprosić o znalezienie komedii, które mogą być teraz w telewizji lub przeszukać listę filmów z udziałem Bruce'a Willisa.

AT & T współpracuje już z programistami nad stworzeniem prototypów dla innych aplikacji w świecie rzeczywistym - na przykład dla aplikacji na telefony iPhone dla iPhone'a - i spodziewa się, że w ciągu najbliższych miesięcy będzie więcej informacji o przyszłości tej technologii.


Jak to działa
Sieciowy system rozpoznawania głosu AT & T to mieszanka. Mieszanie to oprogramowanie, które używa Internetu do łączenia różnych programów o różnych możliwościach. W tym przypadku celem jest połączenie ogólnej aplikacji rozpoznawania mowy - Watson - z takimi obiektami, jak bazy danych lub specjalistyczne oprogramowanie, które obsługuje telewizję kablową lub cyfrową nagrywarkę wideo. W przykładzie zdalnego sterowania na pilocie zdalnego sterowania przechwytuje mowę użytkownika - "Chcę zobaczyć kanał 114" - kompresuje ją i wykorzystuje połączenie bezprzewodowe, aby wysłać ją do serwera z systemem Watson. Watson nie tylko rozpoznaje pojedyncze słowa, ale może też zostać zaprogramowany do wydobywania znaczenia z prostych zdań. Czyni to za pomocą zestawów reguł, które mogą przetrawiać różne zdania wypowiedziane w sposób naturalny w standaryzowany tekst - na przykład "Jaki jest czas?" Oznacza to samo, co "Powiedz mi czas". Tekst można następnie przetłumaczyć za pomocą oprogramowania uruchomienie urządzenia w rzeczywistych komendach maszyny, takich jak przesłanie do telewizora sygnału wyboru określonego kanału

Od lewej dzięki uprzejmości Nuance Communications; GG Electronics; Magellan

Kup Teraz
Rozpoznawanie głosu sprawdza się już w miejscach, w których ludzie nie mają lub nie mogą używać klawiatury.

Magellan Maestro 4250
Ten GPS nawigator rozumie wiele typowych pytań, takich jak "Gdzie jestem?" I "Najbliższy gaz?", Więc możesz trzymać ręce na kierownicy
//www.magellangps.com/

Vocally Infinity
Po podłączeniu do telefonu to urządzenie zachowa do 60 numerów telefonów i wybierze je w odpowiedzi na wymówione nazwisko. Jest skierowany do osób, które mają trudności z korzystaniem z klawiatury numerycznej, np. Niektóre osoby starsze.

Dragon NaturallySpeaking 10
Dla tych, którzy chcą stworzyć dużo tekstu bez pracowników biurowych z powtarzającymi się obrażeniami, na przykład - NaturallySpeaking 10 tłumaczy mowę na drukowane słowa na komputerze stacjonarnym lub laptopie. www.nuance.com


Ciekawe Artykuły

Dorastanie neandertalczykiem: ołowiem, ekstremalnie zimne warunki

Dorastanie neandertalczykiem: ołowiem, ekstremalnie zimne warunki

Dzieciństwo nie było łatwe dla neandertalczyków. Nowe badanie zębów neandertalczyka opublikowane w Science Advances w tym tygodniu mówi nam o nowych szczegółach dotyczących tego, jak mogło wyglądać życie wczesnych homininów w szybko zmieniającym się środowisku. To niespotykane spojrzenie na to, jak nasi starożytni kuzyni poradzili sobie z trudnymi warunkami klimatycznymi i sezonowymi zmianami dostępności zasobów. Wśród odkryć znalazł

Klonowanie Sprawia, że ​​Kozioł Nieprzytomny, Ale Noworodek Umiera

Klonowanie Sprawia, że ​​Kozioł Nieprzytomny, Ale Noworodek Umiera

Wymarły kozioł górski, który niegdyś był powszechny w Pirenejach, na krótko stał się pierwszym zwierzęciem, które powróciło z wyginięcia, ponieważ naukowcy użyli zamrożonego DNA do wytworzenia klonu. Ale noworodek zmarł w ciągu kilku minut od narodzin z powodu trudności w oddychaniu, sygnalizując, że park jurajski marzy o wskrzeszeniu wymarłych gatunków, ale wciąż jest daleko. Pirenejska koziorożec, c

20 rzeczy, których nie znasz ... Kryształy

20 rzeczy, których nie znasz ... Kryształy

iStockphoto 1 Wszystko zależy od rytmu: kryształy powtarzają się, trójwymiarowe układy atomów, jonów lub cząsteczek. 2 Prawie każdy stały materiał może krystalizować - nawet DNA. Chemicy z Uniwersytetu w Nowym Jorku, Purdue University i Argonne National Laboratory stworzyli ostatnio kryształy DNA wystarczająco duże, by móc go zobaczyć gołym okiem. Praca może mieć za

Nectocaris: tajemnicza skamielina to właściwie krewny w sile 500 milionów lat

Nectocaris: tajemnicza skamielina to właściwie krewny w sile 500 milionów lat

W kanadyjskich Górach Skalistych horda 91 kałowatych zwierząt wzrosła z głębin milionów lat po ich śmierci. To nie jest fabuła strasznego filmu B; to robią Martin Smith i Jean-Bernard Caron z University of Toronto. Razem rozwiązali zagadkę około 500 milionów lat. Smith i Caron dokonują przebudowy enigmatycznego stworzenia zwanego Nectocaris . Do niedawna z

W którym WIDZĘ światło

W którym WIDZĘ światło

Giełda Nauki i Rozrywki to program prowadzony przez Narodową Akademię Nauk (!) W celu połączenia profesjonalistów z branży rozrywkowej i naukowców. Chodzi o to, aby poprawić jakość nauki w filmach i lepiej przedstawić samych naukowców. Wygrana w nauce jest oczywista, ale oznacza także lepsze filmy - wielu ludzi w Hollywood chce, żeby nauka w ich filmach była lepsza - i lepsze historie. Wszyscy wygryw

Przepływy lawy: nie możesz ich zatrzymać, możesz tylko mieć nadzieję na ich powstrzymanie

Przepływy lawy: nie możesz ich zatrzymać, możesz tylko mieć nadzieję na ich powstrzymanie

Lawa wypływa z Kilauea na Hawajach i zmierzam do domu w Kalapanie. Ilekroć myślę o zagrożeniach powodowanych przez większość przepływów lawy, mam tendencję do myślenia o początkowej scenie w Przewodniku po galaktyce Autostopem . Deweloperzy planują strącenie domu naszego bohatera Arthura Denta i jako ostatni wysiłek, by powstrzymać jego zniszczenie, Arthur leży przed buldożerem. Kierownik robót w