Czwartek, 30 listopada 2006 :: 20:15:19
Hacking VoIP with Whisky & Google
Jak informatycy popiją to... rodzą się ciekawe pomysły.
Często, korzystając z VoIP, jakość połączenia nie jest idealna. A to utnie sylabę, a to zro-bo-ty-zu-je głos... Rozmówca traci wtedy tzw. wątek, co nie sprzyja sprawnemu załatwianiu krytycznych spraw przez telefonię internetową.
Postanowiliśmy więc, wraz z Collinem, zmierzyć się nie tylko z whisky, ale i z tym problemem :-) Oto, co przyszło nam do głowy.
Popularność oprogramowania voice recognition rośnie, a jakość często jest całkiem niezła - zwłaszcza, jeśli rozmówcy operują językiem angielskim, który easy is. Człowiek, rozmawiając z drugim człowiekiem za pomocą głosu (telefon, face2face), używa niewielkiego zasobu słów - zdecydowanie mniejszego (i bardziej wulgarnego!) niż w mowie pisanej. Tzw. "wytytłany język" :-)
Powyższe pozwala nam wnioskować, że towarzyskie rozmowy telefoniczne są trywialne pod względem językowym, a zatem łatwe do automagicznego przekształcenia na tekst (voice recognition!). O ile się nie mylę, to British Telecom stosuje już nawet jakieś metody teletekstowe, by ułatwić komunikację z BOK osobom głuchoniemym.
Kładąc proste rozmowy i dużą bazę danych (Google!), możemy pokusić się o przewidzenie nie tyle kolejnego zdania w rozmowie, co konkretnego słowa w danym zdaniu. Tezę moją popieram przykładami:
1. Hi, * are you?
2. You fucking *, you killed Kenny!
Zbierzmy zatem powyższe by udowodnić, że dzięki Google rozmowy VoIP mogą być lepsze.
Niezwykle obrazowe "scenario" - Hiacynta i Barabasz
Hiacynta skajpuje z Barabaszem. Zdradziwszy mu adres swojej strony WWW z rozbieranymi fotkami, Barabasz nie wytrzymuje i odpala swojego browsera - a że jest to Opera, (która zamknięta została wczoraj w nocy podczas sesji z 30 otwartymi tabami wskazującymi na serwis http://pornotube.com), wysyca ona łącze na maksa, sute^Wskutecznie zagłuszając atawistyczną radość Barabasza wyrażoną słowami:
— Hiacynto, chyba sobie ze mnie * robisz!! OMG!!!!11
Nasz system DWHV reaguje natychmiast; analizuje odebraną przez Hiacyntę część "Hiacynto, chyba sobie ze mnie" i zauważywszy fluktuację fali dźwiękowej, zrzuca ostatnich słów parę do postaci tekstu (buforując nadchodzący głos), a następnie odpytuje Google, i przetwarza wyniki.
W konsekwencji, Hiacynta słyszy Barabaszowe "Chyba sobie ze mnie", komputerowe "jaja" i znów Barabaszowe "robisz".
Oczywiście, żeby Hiacynte zachęcić do używania DWHV, system pozwala wybrać różne głosy i "failbackowe" teksty w stylu, jaki najbardziej odpowiada Hiacyncie. (Dla ciekawskich, Hiacynta lubuje się w HiP-h0p1e, więc jako failover wybrała sobie zestaw przekleństw i głos "BlackGangstaOnCrack_AND_FeelMyPowahOfSlang++").
Krytyczna ocena systemu DWHV
Pomysł jest świetny :-) I nawet jak nie zadziała zbyt dobrze, to też jest świetny, co potwierdziło 4 na 4 ankietowanych uczestników nosing and tasting session zlokalizowanych po drugiej stronie stołu.
Krótko mówiąc, każdy rozmówca woli usłyszeć coś zupełnie absurdalnego, niż nie usłyszeć niczego i pomyśleć:
No tak, ty bęcwale, dałam Ci moje nagie fotki, a ty się rozłączasz!
(Nota bene, ang. "hangs up on me" zostało w naszym systemie, po krótkiej naradzie, zdefiniowane na sztywno jako "hands up on me", by szybciej stworzyć duże community wokół naszego programu :)
• Następny post:
Google w Pidżamie
• Poprzedni post:
Hacking Playstation 3
Chcesz być informowany o kolejnych wpisach na ten temat?
Kanał RSS: kliknij tutaj. Subskrybcja poprzez e-mail: kliknij tutaj.