Piotr Konieczny

konsultant ds. bezpieczeństwa, podróżnik,
hobbystycznie fuksiarz i gadżeciarz
szkot, prawie spadochroniarz...
nienawidzi zielonego.


« wszystkie wpisy |

Czwartek, 30 listopada 2006 :: 20:15:19

Hacking VoIP with Whisky & Google

Jak informatycy popiją to... rodzą się ciekawe pomysły.

Często, korzystając z VoIP, jakość połączenia nie jest idealna. A to utnie sylabę, a to zro-bo-ty-zu-je głos... Rozmówca traci wtedy tzw. wątek, co nie sprzyja sprawnemu załatwianiu krytycznych spraw przez telefonię internetową.

Postanowiliśmy więc, wraz z Collinem, zmierzyć się nie tylko z whisky, ale i z tym problemem :-) Oto, co przyszło nam do głowy.

Popularność oprogramowania voice recognition rośnie, a jakość często jest całkiem niezła - zwłaszcza, jeśli rozmówcy operują językiem angielskim, który easy is. Człowiek, rozmawiając z drugim człowiekiem za pomocą głosu (telefon, face2face), używa niewielkiego zasobu słów - zdecydowanie mniejszego (i bardziej wulgarnego!) niż w mowie pisanej. Tzw. "wytytłany język" :-)

Powyższe pozwala nam wnioskować, że towarzyskie rozmowy telefoniczne są trywialne pod względem językowym, a zatem łatwe do automagicznego przekształcenia na tekst (voice recognition!). O ile się nie mylę, to British Telecom stosuje już nawet jakieś metody teletekstowe, by ułatwić komunikację z BOK osobom głuchoniemym.

Kładąc proste rozmowy i dużą bazę danych (Google!), możemy pokusić się o przewidzenie nie tyle kolejnego zdania w rozmowie, co konkretnego słowa w danym zdaniu. Tezę moją popieram przykładami:

1. Hi, * are you?
2. You fucking *, you killed Kenny!

Zbierzmy zatem powyższe by udowodnić, że dzięki Google rozmowy VoIP mogą być lepsze.

Niezwykle obrazowe "scenario" - Hiacynta i Barabasz

Hiacynta skajpuje z Barabaszem. Zdradziwszy mu adres swojej strony WWW z rozbieranymi fotkami, Barabasz nie wytrzymuje i odpala swojego browsera - a że jest to Opera, (która zamknięta została wczoraj w nocy podczas sesji z 30 otwartymi tabami wskazującymi na serwis http://pornotube.com), wysyca ona łącze na maksa, sute^Wskutecznie zagłuszając atawistyczną radość Barabasza wyrażoną słowami:

— Hiacynto, chyba sobie ze mnie * robisz!! OMG!!!!11

Nasz system DWHV reaguje natychmiast; analizuje odebraną przez Hiacyntę część "Hiacynto, chyba sobie ze mnie" i zauważywszy fluktuację fali dźwiękowej, zrzuca ostatnich słów parę do postaci tekstu (buforując nadchodzący głos), a następnie odpytuje Google, i przetwarza wyniki.

W konsekwencji, Hiacynta słyszy Barabaszowe "Chyba sobie ze mnie", komputerowe "jaja" i znów Barabaszowe "robisz".

Oczywiście, żeby Hiacynte zachęcić do używania DWHV, system pozwala wybrać różne głosy i "failbackowe" teksty w stylu, jaki najbardziej odpowiada Hiacyncie. (Dla ciekawskich, Hiacynta lubuje się w HiP-h0p1e, więc jako failover wybrała sobie zestaw przekleństw i głos "BlackGangstaOnCrack_AND_FeelMyPowahOfSlang++").

Krytyczna ocena systemu DWHV

Pomysł jest świetny :-) I nawet jak nie zadziała zbyt dobrze, to też jest świetny, co potwierdziło 4 na 4 ankietowanych uczestników nosing and tasting session zlokalizowanych po drugiej stronie stołu.

Krótko mówiąc, każdy rozmówca woli usłyszeć coś zupełnie absurdalnego, niż nie usłyszeć niczego i pomyśleć:

No tak, ty bęcwale, dałam Ci moje nagie fotki, a ty się rozłączasz!

(Nota bene, ang. "hangs up on me" zostało w naszym systemie, po krótkiej naradzie, zdefiniowane na sztywno jako "hands up on me", by szybciej stworzyć duże community wokół naszego programu :)

• Następny post: Google w Pidżamie
• Poprzedni post: Hacking Playstation 3

 

Chcesz być informowany o kolejnych wpisach na ten temat?
Kanał RSS: kliknij tutaj. Subskrybcja poprzez e-mail: kliknij tutaj.

 

Tagi:

« reszta wpisów | • trackback | ‡ torturuj posta!

Komentarze:

1. ładne dupy Czwartek, 30 listopada 2006, 21:51:31
 

Skąd ja wiedziałem na jakiego bloga trafie z joggerowego rssa -_-'...

Do tematu:
"A to utnie sylabę, a to zro-bo-ty-zu-je głos... Rozmówca traci wtedy tzw. wątek"
Ja bym raczej stracił wątek, kiedy nagle bym usłyszał komputerowe "jaja".

 
2. radek.kaba Czwartek, 30 listopada 2006, 23:19:38
 

Mżolwie, że zimaast te ktpouomwree "jaja" mgółby pwoidiezeć ckelwooik... być mżoe to tak smao zoadałzłiaby, jak w paprykzdu leirtek w sołwach:
http://www.mrc-cbu.cam.ac.uk/~mttad/Cigdabmre/idenx.hmtl
;)

 
3. radek.kaba Czwartek, 30 listopada 2006, 23:22:32
 

uhh... chyba przesadziłem ze scramblingiem linka :)
http://www.mrc-cbu.cam.ac.uk/~mattd/Cmabrigde/index.html

 
4. Azrael Nightwalker Piątek, 01 grudnia 2006, 11:20:13
 

Ziom, nawet wsjechmocny gógiel nie jest w stanie przewidzieć wszystkich możliwości zajebistego ziomalskiego slangu. Innymi słowy: będzie totalny rozpierdalejszyn w komunikejszyn.

 
5. Piotr Konieczny Piątek, 01 grudnia 2006, 13:32:52
 

Azrael: Da. Nie nada się Królowej Brytyjskiej, ani dwóm mechanikom samolotowym (specyfika języka). Ale mógłby zadowolić większość, posługującą się najpopularniejszymi słowami.

 
6. Andrzej Piątek, 01 grudnia 2006, 15:05:21
 

Ty Piotrze to masz pomysly :)

Szczerze mowiac, u nas w firmie strasznie by sie to przydalo, bo niedawno przeszlismy na telefonie IP, i chyba managerowie pluja sobie w brode... bo nie zaoszczedza na tym tyle ile im sie wydawalo (czesto calkowicie zrywa polaczenie)

 

Dodaj komentarz:

Wyślij pustą wiadomość, aby śledzić komentarze przez bota.
Komentarze są własnością osób komentujących.
Właściciel bloga nie ponosi za nie odpowiedzialności.
Komentarze nie na temat będą usuwane.

Ofiara

Jeśli powyższy wpis przydał Ci się w jakiś sposób,

autorowi :-)

Czytelnicy:

« wszystkie wpisy