Technologia

Co powinienem wiedzieć o Sztucznej Inteligencji - część 2

28 kwietnia 2020


Czynność “wykrywania” w rzeczywistości jest kombinacją dwóch zadań - stwierdzenia obecności obiektu należącego do określonej klasy jak i zlokalizowanie go na obrazie.

Na nasze szczęście, a jakże, i tu z pomocą przychodzą gotowe zbiory danych, algorytmy, narzędzia i metody interpretacji wyników jak choćby Pascal 2 - znormalizowane zestawy danych do rozpoznawania klas obiektów, zestaw narzędzi do uzyskiwania dostępu do zbiorów danych i adnotacji umożliwiające ocenę i porównanie różnych metod.

Swoją drogą wykrywanie wielu obiektów, takich jak okulary, telefony  lub krzesła, jest ekstremalnie zależne od informacji kontekstowych, ważne jest, aby zestawy danych wykrywania zawierały obiekty w ich naturalnym środowisku. Chcemy w końcu aby maszyna wiedziała, że częściej znajdzie klucze np na stole niż odizolowane w pobliżu chmury :)

Maszyna wie, maszyna widzi - przejdźmy więc do oznaczanie scen semantycznych.


JAKIE SCENY?

Zadanie wymaga, aby każdy piksel obrazu był oznaczony jako należący do konkretnej kategorii, takiej jak ziemia, niebo, budynek, droga itp. aby wiedzieć na jakie otoczenia spogląda maszyna.

Przykłady:

  • SUN  - 3819 kategorii obiektów obejmujących dane dla obiektów (kwiat, koszulka, samochód) oraz dla scen semantycznych (niebo, podłoga, skwer). 
  • zestawy danych Middlebury - j.w.
  • zestaw danych segmentacji Berkeley  - j.w.

Ponieważ zbiory tych danych zostały zebrane przez znalezienie obrazów przedstawiających różne typy scen, liczba wystąpień przypadających na kategorię konkretnego obiektu wykazuje zjawisko długiego ogona. Jest to całkowicie naturalne zjawisko. Oznacza to, że kilka kategorii ma bardzo dużą liczbę wystąpień (ściana: 20 213, okno: 16 080, krzesło: 7971), podczas gdy zdecydowana większość ma stosunkowo skromną liczbę wystąpień (łódź: 349, samolot: 179, lampa podłogowa: 276).

Potem dochodzą jeszcze założenia związane z matematycznymi wzorami na naukę i doskonaleniem algoytmów tak aby sztuczna inteligencja przestała być słaba i skoncentrowana na jednym wąskim zadaniu, a stała silna i dużo bardziej podobna do człowieka potrafiąc samodzielnie myśleć i wykonywać zadania.

Zabawne, że rozpatrując jedno, proste - z perspektywy człowieka - zadanie dostrzegamy dziesiątki różnych problemów i mikro-zadań, które trzeba rozwiązać by maszyna choć częściowo mogła wykazać elementy intelektu. 

Dlaczego więc chcemy tego dokonać i dlaczego szczególnie mocno naciskają na ten postęp chińczycy?


CHIŃSKA DOMINACJA

Istnieje wiele poszlak, które wskazują na ten sam cel  - szybki  i gigantyczny zarobek.

Jest to jednak spore uproszczenie. 

W praktyce temat jest tak wielowymiarowy, że można by o nim napisać całą książkę (co w sumie już uczyniono :))

Widzisz Chińscy przedsiębiorcy nie mają luksusu zachodnich koncernów w postaci stworzenia algorytmu i produktu, na którym będą mogli zarabiać przez następne lata. Jeśli uda im się zbudować działający produkt, którego chcą ludzie, nie mogą ogłosić zwycięstwa. Muszą wypowiedzieć wojnę. Wojnę z milionami innych, wygłodniałych osobników, którzy nie marzą o niczym innym jak wykorzystać i skopiować ich gotowe rozwiązania. Konkurencja jest tu tak duża i aż tak brutalna.

Że niby zdarza się to i u nas? Może, lecz niech kontrargumentem będzie pewien zasłyszany cytat dotyczący tempa działania Chin: „Andrew, jesteśmy w Dolinie Krzemowej. Musisz przestać nas traktować, jakbyś był w Chinach, ponieważ po prostu nie możemy dostarczyć rzeczy w oczekiwanym tempie”. Chiny nie znają słów “wolniej” ani “później” bo wiedzą, że każdy potencjalnie zły krok oznacza wypadnięcie z rynku. Pracują jak szaleni by móc zrealizować swe marzenie - marzenie “cyfrowego świata jutra”.

Analitycy nazwali tę rynkową eksplozję „rewolucją O2O” (w skrócie „online-offoffline”), która może być myląca, ale koncepcja jest prosta: zamień działania online w usługi offline. Myślisz Uber i wiesz już o co chodzi. Rewolucja O2O polega na wprowadzeniu tej wygody w stosunku do rzeczy, których nie można umieścić w kartonowym pudełku - gorące jedzenie, przejażdżka do baru, ostrzyżenie, doniesienie zakupów etc. AI jest w tym przypadku niezwykle pomocne bo pozwala lepiej rekomendować klientowi i jednocześnie lepiej go rozumieć.

I właśnie o zrozumienie, a właściwie “sprofilowanie”, tutaj chodzi!


AI, A BIZNES

To ma mieć swoje konsekwencje w postaci uczucia “przywiązania” do marki (‘ta firma wie dokładnie czego mi potrzeba”), a kiedy podepniemy pod to takie molochy jak WeChat (zainstalowany na ponad połowie wszystkich smartfonów w Chinach w większości przypadków połączony z kontami bankowymi użytkowników) to idea sztucznej inteligencji, która jest w stanie przywołać taksówkę, zamówić posiłek, zarezerwować hotel, zarządzać rachunkiem telefonicznym i zrobić dziesiątki innych zadań “znając” mnie - staje się ekstremalnie kusząca.

Ale rewolucja O2O oznacza coś więcej niż jedynie próbę podporządkowania sobie świata za pomocą AI. O nie! O2O oznacza także, że na naszych oczach nastąpi podział na firmy z „lekkim” AI i „ciężkim” AI. Terminy te odnoszą się do tego, jak bardzo zaangażowana jest firma internetowa w dostarczaniu towarów lub usług  by połączyć światy online i offline. Dla przykładu amerykańskie firmy przyjmują podejście „lekkie” uważając, że podstawową siłą Internetu jest dzielenie się informacjami, uzupełnianie braków wiedzy i łączenie ludzi w formie cyfrowej i AI powinna pomóc w tym obszarze. W Chinach z kolei preferowane jest podejście “ciężkie”, które sprowadza się do tego by AI zdobywał, analizował i działał tak by za wszelką cenę firma mogła zarobić. Po trupach do celu.

Nie wybielam tu, rzecz jasna, firm z Zachodu. Wskazuję raczej pewne różnice w działaniu.

Na to wszystko nakłada się również chęć pozbycia niepotrzebnych pracowników, których można zastąpić maszynami. Analitycy “szacują”, że za kilka lata zautomatyzowanych zostanie od 9% do 47% zawodów - różnica pomiędzy szerokim dobrobytem, a bezpośrednim kryzysem zatrudnienia. To zaś odbije się na trzech głównych sił działających na globalną gospodarkę: demografii, automatyzacji i nierówności.  Jeśli przyjmiemy, żę do 2030 pracodawcy będą potrzebować ~25% mniej pracowników to co wydarzy się z tymi osobami? Niektórzy najpewniej zostaną ponownie wchłonięci w nowe zawody, które obecnie prawie nie istnieją (technik naprawy robotów?), ale reszta? Jak ich zachowanie przekuje się na pozostałe 75% pracujących?

Zwolennicy przekwalifikowania pracowników mają tendencję do wierzenia, że sztuczna inteligencja będzie powoli zmieniać umiejętności, na które jest popyt, ale jeśli pracownicy będą mogli dostosować swoje umiejętności i szkolenie, to zapotrzebowanie na siłę roboczą nie spadnie wcale (lub jedynie marginalnie). Ja z kolei zadaję pytanie - czy nie spowoduje to głębokie przesiedlenia lub wyparcia pracowników z ich naturalnego ekosystemu?

  • linkedin
  • twitter
  • facebook

Podziel się

Dołącz do dyskusji