Marcin Sikorski
To zadziwiające jak przymusowa izolacja wywołana korona wirusem sprawiła, że firmy, szkoły i wszelkiej maści instytucje w błyskawiczny sposób opanowały magiczną sztukę pracy online. Nagle da się załatwiać sprawy zdalnie, robić telekonferencje by móc porozmawiać z petentem, odpowiadać mailowo bez konieczności fizycznej interakcji.
To prawdziwy cud jak szybko da się opanować technologię jeśli tylko ma się odpowiednią motywację.
Kiedyś jednak kurz opadnie, świat wróci na stare tory, a ludzie powrócą do swoich nawyków. Chociaż, jak na ironię, w międzyczasie, w tym całym szaleństwie, gdzieś tam, niepozornie i z dala od dociekliwych spojrzeń, pojawi się cichy zwycięzca całego tego zamieszania. Taki, który niespiesznie rozstawił swoich tech żołnierzy po całym świecie, a teraz, w czasie kryzysu, zbiera powolutku żniwo udowadniając swoją przewagę.
Mowa tu o smart asystentach.
Tych prostych, tanich urządzeniach rozsianych po każdym zakątku globu, do których teraz, jak nigdy dotychczas, swoje zapytania kierują ludzie z całego świata.
Ile to nie słyszeliśmy haseł pokroju: “Wielka rewolucja technologiczna, która obejmuje głos. Konsumenci, którzy stopniowo odchodzą od ekranów na rzecz innych interakcji. Powolnie przemijająca era dotyku, a rozpoczynająca się era mówienia i słuchania.” Ile to nie powstało raportów na ten temat. Ilu specjalistów nie wypowiadało swoich śmiałych tez. Ile to liczb nie przelano, żeby przekonać niedowiarków. A tu raptem przyszła izolacja i nagle wszyscy się przekonują do smart rozwiązań i uznają prawdę tych stwierdzeń.
Może i jestem adwokatem diabła, ale spójrzmy na to z perspektywy technologii.
Z jednej strony rozlała się panika przed dotykaniem, a z drugiej strony wstyd przyznać, że wewnętrzna potrzeba kontaktu gdzieś tam w sercu gra. Z jednej strony chcemy zachować dystans, a z drugiej już wypadałoby móc wejść w interakcję. Z jednej chcemy żyć jak dawniej, ale z drugiej przydałaby się jakaś technologia, która by umożliwiła nam ciekawszą alternatywę.
Jak na ironię Internet Rzeczy, który był dotychczas tak mocno pomijany lub lekceważony doskonale odnajduje się w tych trudnych warunkach. Nagle smart asystenci stali się docenieni i potrzebni. Nagle tak wielu uświadomiło sobie, że nie chce już dłużej statycznej, prostej odpowiedzi i bierności w działaniu maszyn. Zwyczajnego dotykania ekranu i prostackiej wręcz obsługi swoich codziennych potrzeb. O nie - my chcemy jakiegoś asystenta, z którym możemy pogadać i który będzie wiedział lepiej niż zwyczajna maszyna. Chcemy asystenta, któremu zlecimy swoje bezpieczeństwo, kontrolę zamków w drzwiach, weryfikację wysłanej paczki lub korektę ciepła w mieszkaniu. Asystenta, który sugeruje nam dobrą muzykę, rozwieje wątpliwości lub zarekomenduje serial na Netflixie. Asystenta, który zrobi to w czystych rękawiczkach i bez naszego fizycznego kontaktu.
To doprawdy niezwykłe w jak krótkim czasie ludzie zaczęli doceniać interakcję głosową. Jak zmienia się na naszych oczach postawa niedowiarków. Dotychczasowe obawy o swoje dane przestały być istotne gdy w grę weszła możliwość bezpiecznego mówienia zamiast dotykania. W mig ludzie odkrywają nowe funkcjonalności, które dotychczas były “zbyt trudne i skomplikowane”. W krótkim czasie dało się przekonać do smart urządzeń i współpracy głosowej. A wszystko to w wygodny, niezobowiązujący sposób, który przemawia do wyobraźni konsumenta.
A pomyśleć, że jeszcze na początku roku vCommerce (zakupy głosowe) brzmiały równie niedorzecznie co idea eCommerce dwie dekady temu. Teraz brzmi zupełnie sensownie.
Rodzi się jednak pytanie w jakim kierunku będzie rozwijać się ten trend. Czy trzeba będzie wskazywać ludziom właściwy tor - jak jeszcze nie tak dawne “zapraszamy na stronę internetową” - czy sami będą z zaciekawieniem kierować się do słuchowych doznań? Czy reszta niedowiarków domyśli się? A jeśli tak to po jakim czasie?
Wierzę, że jest to jak najbardziej możliwe do realizacji biorąc pod uwagę ilość zadowolonych użytkowników, którzy już teraz prowadzą życie oparte o komendy głosowe. Zeszłoroczny raport “Voice report - From answers to action: customer adoption of voice technology and digital assistants” potwierdza, że 80% konsumentów jest zadowolonych z formy interakcji. Interakcji, które służy im do wyszukiwań oraz wydawania komend. Do wygodniejszego i efektywniejszego kontrolowania swojego życia.
Co prawda nadal najmniej chętnie dzielą się oni swoimi danymi o koncie, zleceniami do banków, kasowaniem zamówionych przesyłek czy, co w sumie ironicznie, głosową chęcią kontaktu z drugim człowiekiem. Zadziwiająco rzadko korzystają też z usługi pozostawiania oceny i komentarza mimo, że text-to-speech oraz speech-to-text już na obecnym etapie działają bardzo wydajnie i efektywnie.
Nie, żebym nadal miał być wspomnianym adwokatem diabła ale postępu nie da się osiągnąć słodkim i bezcelowym narzekaniem. Wypadałoby się odważyć dalej i mocniej i sięgać po nowe skoro za rogiem czają się takie możliwości jak znajdowanie powiązanych ze sobą informacji (kontekst), skanowanie kodów kreskowych, o których asystent mógłby coś opowiedzieć, weryfikacja po cenie i wedle preferencji czy inne bajery, których dziś jeszcze nie do końca rozumiemy ale za dekadę będą one standardem branży.
Asystent głosowy, który zna się na wszystkich plamach świata? Czemu nie.
Asystent głosowy, który wie jak pokroić dowolny owoc i warzywo? Czemu nie.
Asystent głosowy, który zna się na meandrach prawnych? Czemu nie.
Asystent głosowy, który analizuje mieszkanie i pomaga niewidomemu? Czemu nie.
Asystent głosowy, który doradza przepisy? Czemu nie.
Asystent głosowy, który zabawia dziecko historyjkami? Czemu nie.
Świat jutra będzie opierać się o głos bo i to jest bliższem sercu niż “tapanie w ekran dotykowy” i ściąganie setek nikomu niepotrzebnych śmiecio-aplikacji. Łatwiej będzie wyuczyć i dostosować sobie głosowych asystentów, którzy wiedzą jaką lubimy kawę, jakie nosimy koszule i które kwiaty preferuje nasza żona niż pseudo apkę bez duszy i krzty polotu.
Swoją drogą do wielu osób nie dociera jeszcze fakt, że w niedalekiej przyszłości wyszukiwarki będą działać odrobinę inaczej. Bo o ile na ekranie jesteśmy w stanie kliknąć w ferworze poszukiwań kilka pierwszych linków (ale nie dalej jak do pięciu/sześciu) tak asystent głosowy, któremu zadasz pytanie “najlepszy cieśla we Wrocławiu” poda Ci najpewniej pierwszy wynik. I lepiej, bóg mi świadkiem, żebyś to ty był tym cieślą. Bo konsument będzie miał gdzieś piątą, dziesiątą czy setną pozycję. Także jeśli ktokolwiek sądził, że teraz jest ciężko zareklamować siebie i wypozycjonować w wyszukiwarkach niech poczeka na erę głosu. Wtedy dopiero będą działy się interesujące sceny. Pozycja zero będzie nowym opus magnum za który firmy zapłacą horrendalne pieniądze.
Abstrahując jednak od tego, jeśli spojrzymy na motyw komunikacji głosowej, to niezwykle interesujące jest to jak zaciera się ta sfera intymności i ludzie stopniowo przekonują się do coraz to większej i częstszej interakcji z asystentami głosowymi. W raporcie “The Future of Voice and the Implications for News” można przeczytać, że ludzie zwracają się do Alexy per “Ona” raczej niż “To”, dodają często “proszę” i “dziękuję” czy spoufalają się opowiadając czasem więcej niż wstępnie planowano. Nieśmiały kontakt z maszyną staje się stopniowo coraz dojrzalszy i śmielszy, a nikt do końca nie wie gdzie ma on swój początek, a gdzie koniec.
Czasem zastanawiam się do jakiego stopnia ludzie będą skłonni spoufalać się i czy nie będą odbierali tego jak zdziecinnienie. Ile w tym wygodnictwa a ile powierzenie swojego życia drugiej stronie. Nie zrozummy się źle - jak najbardziej popieram idee asystentów tylko czy ktokolwiek będzie weryfikować źródło informacji? Czy ktoś będzie potem sprawdzać tę samą informację na kilka innych sposobów czy skończy się na klasycznym “tak mówi, tak jest”. Czy ktoś zada sobie jakikolwiek tru skoro już teraz jest z tym ciężko.
Zastanawiam się nie bez przyczyny skoro wedle danych większość osób nie zmienia nawet domyślnego źródła informacji, nie angażuje się w lepsze zrozumienie jak działa system, nie sprawdza kto jest dostarczycielem informacji. Do tego prawie połowa (46%) respondentów używa regularnie funkcji newsów, ale już raptem tylko 1% twierdzi, że jest to najcenniejsza z dostępnych funkcji asystenta. Ot i zrozum ludzi.
Jeśli miałbym mieć obawy co do tego jak asystenci mogą zawieść oczekiwania to wskazałbym klasyczne choroby młodzieńczego wieku:
Za dużo aktualizacji, które nie wnoszą nic do życia a przeszkadzają absolutnie każdemu.
Brak pomysłu na siebie w przypadku wielu wydawców, którzy jeszcze nie do końca uwolnili potencjał kryjący się za głosem.
Nienaturalne nagrania w przypadku wielu producentów, którzy chcą ale nie do końca wiedzą jak.
Brak dostatecznej transparentności w przypadku wielu usługodawców tzn. co oferuję i czego możesz po mnie oczekiwać.
Poza tym przydałoby się żeby częstotliwość aktualizacji szła z jakością, producenci pozbyli się nachalnych dźwięków, dzingli i innych śmieci, które zagłuszają jakość nagrań czy warto by dostosować jakość emitowanego materiału do dostępnego pasma internetowego.
Ale to takie klasyczne problemy, które da się rozwiązać z czasem. Nic z czym nie dałoby się teraz żyć i co by miało przekreślić pozytywny wizerunek głosowych asystentów.
A ci mają przed sobą naprawdę doskonały moment na zrobienie burzy na rynku.
Ludzie mają dość setek aplikacji.
Ludzie mają dość nieustannego patrzenia się w ekrany.
Ludzie mają dość dziesiątek pilotów i braku uniwersalnego środowiska.
Ludzie chcą czegoś nowego stąd póki usługodawcy nie będą się chować za sztandarowymi wymówkami “to kosztuje, nie mamy zasobów, nie wiemy jak tego dobrze użyć” to sądzę, że bilans zysków i strat przemówi na rzecz funkcji głosowych.
Prostsze, bezdotykowe życie. Automatyczne funkcje. Futurystyczny posmak. Redukcja zbędności.
A z drugiej strony niemałe kłopoty z bezpieczeństwem. Wymagana cierpliwość. Limitowne, natenczas, funkcje.
Ciekawi mnie dokąd będzie zmierzać ten rynek, który z roku na rok powiększa się w szaleńczym tempie podobnym do smart opasek.
Ciekawi mnie jak opakują to producenci, którzy już teraz oferują “Flash briefing”, “Narrative news” czy “Audio news” zamiast “zwyczajnych wiadomości.
Ciekawi mnie czy zaufanie ludzi umacnia się gdy wszystko wróci do normy czy otworzą się przed nami nowe i jeszcze ciekawsze możliwości.
Bezdotykowy i głosowy świat jutra zupełnie przypadkiem dostał sprzymierzeńca, którego nikt, przy zdrowych zmysłach, nie życzył sobie ujrzeć. A jednak to wydarzyło i dzieje się nadal i kształtuje nasze realia.
Chiny otrząsają się i rozgrzewają fabryki, w których już teraz czekają tysiące nowych zamówień. Zamówień na kolejne edycje głośników i smart asystentów, które spływają z całego świata. Świata, któremu siłą wmuszono nowe reguły.
Ale może te wyjdą wszystkim na lepsze?
Może rzeczywiście świat jutra opiera się o głos tylko potrzebowaliśmy by ktoś nam to w porę uzmysłowił?