Celý záznam je dostupný na PATREONU

Dušan Janovský (expert na vyhledávače): Seznam vs. Google, umělá inteligence, matematika a vektory

Dušan Janovský alias Yuhů. Autor webu jakpsatweb.cz, webmaster, který pracoval v Google a dnes dělá v Seznamu, expert na vyhledávací algoritmy. Baví ho ekonomie, ekologie, hudba, cestování, stopování, politika…

Automatický transcript

Minuta: 0
Dámy a pánové dnešním hostem na StandaShow je Dušan Janovský webmaster s přezdívkou juhů autor webu, jak psát web.cz, pracoval jsi v Googlu teď děláš v seznamu a vítám tě našla jsem přišel. Děkuji za pozvání, Dušane. Už jsme přišli na to. Co se stane, když napíšeš do Google slovo Google zboží s tím Internet. Já jsem to strašně dlouho nezkoušel, ale jsem si vědom toho, že lidi to zkoušej stejně Často asi jako píšu do seznamu slovo seznam a to se stává zcela běžně. Hele asi lidé co to co napíšou do vyhledávání v seznamu seznam a nemyslí to jako fór. Já ti to nemusíš vědět, že jo, ty jsi na internetu a otevře se ti internet, tak napíšeš do vyhledávacího políčka seznam klikneš na první odkaz a teprve pak Jseš si jistej, že jsi na Seznamu nemusíš přemýšlet jo, ne. Přemýšlet
Minuta: 1
co je to na tebe na váš tě určitě. Takže prostě on nemusí přemýšlet, kam přišel přijde na internet napíše seznam proklik ne. Víš, že na Seznamu No to jsem se snad někde dočetl, že spousta lidí píše takhle vyhledávače vyloženě třeba adresu www.facebook.com, aby s proklikem na ten Facebook. Hele lidi jsou strašně zvláštní různí a jak říká Marek Prokop základní vlastnost uživateli je ta, že já pokorní obskurní a že se chová jinak než jiné lidi a že vlastně všichni lidi se chovají jinak než její lidí a že hrozně těžké najít nějakého průměrného uživatele. No mně se třeba moje zkušenost. Včera jsem dostal jsem si vzpomněl na Google a myslím, že seznam určitě má autokorekce, když něco napíšeš, ne úplně přesně, tak se ti to snaží doporučit a já jsem se včera nachytal, že já to někdy napíšu, tak prasácké jako do toho vyhledávání, že se prostě nad tím, že si nedám vůbec naschvál záležet a napiš to prasácky a spoléhám na to, že ten Tak
Minuta: 2
to opraví a domyslí se to. Já včera jsem to napsal, tak prasácky, že to nezvládnu prostě úplně každý tři slova každé slovo úplně jinak to překlepů, tak to je třeba moje chování, které jsem na sobě to znamená vlastně dokonce pocit, že lidi v do vyhledávání se dávají překlepů čím dál tím víc postupem času je tak to samozřejmě může být s tím, že na ten internet přicházejí další a další kohorty uživatelů, ale může to být i tím, že na ten vyhledávač víc a víc spoléháme, že to za nás opraví a představ si sebe před patnácti lety. Jestli by jestli by sis pokud to opravdu chceš něco najít, jestli by jsi si dovolil do vyhledávače něco zadat nepozorne s překlep a možná by jsme našel a dneska už vlastně víš, že on ti bude opravovat to opravování je mnohem složitější úkol, než než jsme si třeba seznamu strašně dlouho mysleli teď já vlastně nevím, jestli je venku, ale viděla se nějaká nová verze, kdy už překlep a doručíme čistě umělou inteligencí v myšleno neuro-mag jako na nějakých datech se to učili. A nějaký
Minuta: 3
metry strojové učení tam byli vždycky, ale teď jsem zapojují čím dál a hlubší neuronové sítě a myslím si, že už se dá říct, že už ani The programátoři, když se fakt hodně snažit. Tak už nevědět, co ty komponenty dělají na tom na tom překlep. Aha to na vyhledávání jako takovým tenhle stav už je zcela běžné, že vlastně nevíme přesně co se tam v pozadí je, že sami programátoři to jak udělají vypustí, ale vlastně neví úplně přesně, jak ty věci do detailu. Funguje si to dělá ta inteligence sama do značné míry. Ano, tak jako slovo programátor. Je to trošičku nepřesně použití, protože mi rozlišujeme lidi, které se starají o ty věci, jak mají fungovat. To jsou produkci a oteklý. Co zařizují to jsou ty programátoři to ostatně ze seznamu znáš. A samozřejmě Ani programátoři. Ani ty produkty už ani teď nevědí, jak přesně to funguje vevnitř, protože tam spousta komponent, který už si nějakým způsobem poradí sami. Hele Říkal jsem na začátku, že ty jsi pro Google
Minuta: 4
děláš tak jsi pracoval se znám, tak jsi odešel. Tak se zase vrátil. Pak jsi odešla historien, ale děláš teď v seznamu a já mám prostě znám, já jsem formálně konzultant okay o tom, jaké je teďka největší rozdíl z tvého pohledu mezi vyhledávání na Googlu a vyhledáváním na Seznamu. pro uživatele No tak já bych byl strašně rád, aby pro ty uživatele tam nebyl žádný rozdíl. A kdyby to bylo jako, když jsou v sámošce vidí brambory číslo 1 regálu a brambory číslo na regálu, aby se to stalo. Prostě komoditou a ne, že bych byl úplně rád, ale prostě podle mě názor se to tak děje, že lidi málo rozlišují se hraje na Googlu nebo na Seznamu. Oni v první řadě hledají na internetu a dokonce se ani neuvědomuju, že to není integrální součást internetu, že co zařizuje nějaká služba. Ale ty ses ptal jak Jaký je největší rozdíl pro uživatele a možná to ještě upřesním do té mistrové
Minuta: 5
otázky vyhledává Google týpek seznam určitý typy dotazů. Ano a na něm je teď jsem se opravdu zkouším hodně dívat, takže máme nějaké měření vlastně už od roku 2005, co jsme spustili současný současný vyhledávač fulltextový, tak samozřejmě míříme. Každý v podstatě se dá říct každý den měříme. Jak se daří různý vyhledávačům včetně seznamu včetně Googlu většina těch dát. Je neveřejných mi jako neříkám a v kolik má lepší nebo horší od Googlu máme samozřejmě i s nějaký sady dotazu, kde jsme lepší, nebo kde nám aspoň ty anotace od uživatelů nebo Brigádníků říkají, že jsme lepší. A teď si myslím, že Google výrazně výrazně zlepšil oblast těžkých Dlouhých dotazů informační povahou, takže je tam teď budu muset seznam hodně hodně makat, jak se to měří jako jak
Minuta: 6
jak vy to zjistíte, který jak Co je lepší výsledek nebo není lepší výsledek, to je veliká Věra. No právě a taková jednoduchá metoda, ale dost používaná je ta, že jsi prostě vezmeš ty výsledky. Stáhneš si je dát dlužíš nějaký můžeme tomu zeptáš se jich, jestli jsou dobré nebo ne. Řekni mi, že na to máme brigádníky nebo To děláme jako zaměstnanci přímo něco. Ano to můžeš se dívat i třeba na další věci. Třeba já klidně na daný výsledky klikaj, nebo ne klikají. Nebo jak s nimi přeformulování a tak dále a je to opravili k věda a dokonce bych trochu říct, že za těch 15 let, co se tomu intenzivně věnujeme nemáme schodů na tom, jak je to nejsprávnější zlatý standard state-of-art je prostě sehnat si anotace zaslepený, aby lidi nevěděl, jestli janatovou Seznam nebo Google ideálně výsledek výsledku,
Minuta: 7
ne celý ne celou 10x. Jeden po druhém a nechat se vlastně jo. No anotovat, jestli je to přes na odpověď, jestli už je Tecna a potom nad tím udělat nějakou matematiku krátit vliv na výsledné číslo a takhle se můžeš porovnávat, jednak sám se sebou. Což je velice důležité a jednak pro orientaci se můžeš porovnávat i s tím jiným vyhledávačů. Pro nás samozřejmě těší se porovnávat sami se sebou. A tím myslím starý model, který je v produkci s něčím, co by věnujeme Nově A chceme si zjistit, jestli to hledá líp nebo hůř, tak to je taková validace. Třeba posledním předtím než něco nasadíme, ale na něho těch anotovaný, kdy vlastně vím. A nebo si myslíme, že víme co by na který dotaz mělo být, tak, my jsme schopni nad těhle těch datech učit i tu jistě modely z pravého. Učení je dneska už bych se nebál tomu říkat umělé inteligence. Jak to myslíš? Já myslím to tak, že když jsme tam jeli do stravy učení, tak jsme ještě vědět, jak to funguje a teď už nevím a nebo už jako jsou
Minuta: 8
tam prostě komponenty, kdy kdy se o to ani Nesnažím a protože ten Viktor uprostřed neuronové sítě má třeba plácnu. Třeba 256 bytu takový rozsypaný čaj od toho absolutně nic nezjistíš, co si ten vyhledávač potom dotazu myslí a vidíš prostě tak Thor a můžu porovnávat ty ne Viktorem Hele, ale z toho mě napadá není trošku pro ten vyhledávač problém, když já napíšu lednice, tak může to být lednice město může to být může si chtít koupit novou lednici prostě na Alze a a teďka jak ten vyhledávač pozná Jakou lednici myslím, kterou mi jako má v tu chvíli dát. Nepozná, že jo, tak správně má zjistit, že tohle to je dotaz vyžadující pestrost a ty a ty výsledky namíchat. že máš hrozný typy dotazů máš třeba dotazy které vyžadují čerstvost máš typy dotazů které vyžadují seznámí jakože přehled možností
Minuta: 9
máš typy dotazů které vyžadují správnou odpověď na prvním místě když se ptáš na nějaké navigační dotazy zřejmé že chceš přijď na nějaký web A když ty půjdu ta soutěž je strašně moc mi třeba seznamu máme takový základní dělení na tři typy dotazů kde říkáme že je to že jsou navigační jiné jsou informační a třetí jsou transakční Co jsou pro nás Hlavní 3no ženy podle kterých se orientujeme navigační si dokážu představit to je to když někdo napíše Facebook ano asi dost a zbytek to ani nezajímalo a ty další dvě kategorie taxisova informační To jsou takový Kde je primárně chceš informaci je jedno je ti jedno Odkud že třeba tě zajímá tě někdo kdo se účastnil bitvy u Hradce Králové a jeď Jestli to nejdeš na historie.cz nebo na Wikipedii a ty tři ten cítit i proto jsou transakční Kdy ty si chceš koupit tu ledničku nebo koupit něco jiného nebo objednat
Minuta: 10
patreon v něco takového. A tam vlastně chceš provést u transakci. Taky je ti víceméně jedno kde? Chci si něco koupit. Není to jenom informace, ale je tam na konci i ta transakce nějaká akce potom ve výsledku. Já mám toho uživatele a dělení. No jo. Jo rozumím a já si pamatuji ještě doby, kdy na google.cz nebyl Google. To už je ale tam nic mít a snad roku 2006 nebo takhle nějak no, no a co ty říkáš na to vlastně ten ten Trend byl takový nevím, jestli tam ještě je to budeš vědět, že vlastně seznam měl zájem 80 90% všeho vyhledávání na českém internetu probíhalo přes Seznam potom Google přišel přeložil se do češtiny koupil si.cz doménu a postupně vám začal ukrajovat. A přišlo mi, že během posledních několika let, tak ten Google jako trošku vyluxoval
Minuta: 11
to vyhledávání a seznamu. Je to pravda nebo ten mi jenom teď se zeptal asi na 10 věcí najednou. Jo, takže to po nějakých rozklíčovat Google tady rozhodně nezačal. V roce 2006, když si koupil celé doménu, ale už předtím jeho znalost byla celkem široká a já jsem řekl, že chápu motivaci té české pobočky, která chce říct. V roce 2005 jsme byli na nule Jana a pak jsme za rok vyskočily, když my jsme přišli na 40% Není to pravda. Jo, on je tady prostě byly silné a lidi zvědavý na google.com. Já nevím, jestli těch lidí bylo 20% 10
Minuta: 12
chvíle, kdy se česká veřejnost a zajímala Google, protože mě zajímalo ten Red box ten Docela hodně česky vyhledávačů, no, dík, za to bylo vlastně ještě mladší, ale přesně, ale my jsme byli úplná anomálie v těchto v devadesátých letech. Jde tady prostě byl centrum byl tady Atlas byl tady se znám a byl tady megatex. Nevím jestli ještě pamatuješ, to byly jako úplně neuvěřitelný, dneska by se řeklo start-up je pak samozřejmě Jackson velmi rychle a ještě na ty technologiích a jakým způsobem fungovalo něco, co se jmenoval empyreum. Takže těch vyhledávačů Českých tady byl obrovský a dá se říct, že vlastně to že seznam dneska furt existuje na tom trhu je důsledkem této ty veliký plurality ve vyhledávačích těch raných letech nebo ještě v devadesátých letech, kdy se česká programátorská veřejnost
Minuta: 13
naučila, že to jde. že se dá hledat na internetu Já si totiž myslím že ta scéna v těch vyhledávačů byla tak zcela kvůli tomu že Google přišel a teď jako nechci říkat Ty jsi tam byl v roce 2202 nebo 2426 on přišel obchodní politikou která se tak trochu nedala odmítnout když říkal Hele tak jako vyhledávání těžký jako portál a říkal to každému na světě včetně velkým hráčům typu Jahu Vím jako portál prostě s tím nemusíte zabývat tak to nechte na nás dej se tam prostě vyhledávání Googlem políčko s logem Googlu Ve výsledcích bude logo Googlu a to bude dobrý a my jsme se musím jet do té nabídky nastavit taky zajímá jako v době kdy jsme ten Vlastně fulltextový vyhledávač ještě neměl úplně hotový a potom krátce poté kdy jsme ho měli A já tenkrát Já si nepamatuji do tenkrát říká myslím,
Minuta: 14
že to byl Tomáš kapalin, který tyhle nabídky přirovnával k ke korálkům a sklíčku má zrcátkům přivezli tu Holanďani. Já ty portugalci na těch lodích domorodcům. A měnili to za to zlato. Já vlastně ty nabídky koleje pro firmy, které neměly vlastní vyhledávací technologie byli velice lákavý, tak potom vedly k naprosté závislosti někdy sejdeme vlastně vypnuli své vlastní hledání a potom jako to Googlu nevyčítám jo, ale potom přidávání uživatele odcházeli chodili na Google, nastavovali si jako domovskou stránku Google, jo. A já tě v tomhle tom v Googlu hrozně fandím i jsem fandil tenkrát jo. Podle mě google a seznam nejsou v první řadě je. Nepřátelé na tom trochu jako dost. Konkurenti, ne konkurenti jsou ale není to tak, že bychom prostě se nenáviděl
Minuta: 15
již máme stejný cíl udělat pořádek v informacích říkat to, co říkáš zní to vlastně pěkně, ale stejně ve výsledku, tak přece tam musí viset nebo i v té době, tak tam muselo by to riziko toho, že Google velká firma s mnohem větším kapitálem na vývojáře největším kapitálem na různé jako světový hlavně vývojářů a a i s více peněz má jako obecně, tak je schopná tyhle těžké technologie ve výsledku udělat líp a jestli jste se prostě Nebáli toho, že nebudete stíhat tomu Google, že ten k nám to prostě jako přetlačit nový mobil bylo. Samozřejmě to samozřejmě jsme jako věděli, že to takhle hrozba existuje a kdyby mi někdo řekl tenkrát v roce 2006, když jsme tak nějak jako v pořádně rozjížděli tam Pět šest, no, že je tady s tebou budu sedět v roce 2021. A seznam prostě bude mít 25 24 procent trhu vyhledávacích,
Minuta: 16
vole, tak já bych tomu nevěřil. No takže ano, jako obava tam byla, ale taky jsme si byli vědomí, že vyhledávání se velmi dobře magnetizuje. Teď jsme se ho nechtěli vzdát jako seznam rozumím Jan barášek se ptal na Facebooku. Jestli Dušane vnímáš bojí seznamu a Googlu v rámci vyhledávání jako za prohraný teď už a nebo je tam ještě možnost, aby se to dál drželo třeba těch 10 let zarážka. Já na té zastávce nerozumím skoro. Ani jednomu slovu a to vlastně moc nepřeháním, jo. Tak už jsem myslel, že to není boj, že to je nabídka uživatelům, ať si prostě zvolit se jim vyhovuje, jestli ho vnímám za prohraný existují firmy, které používají evidentně špatnou metodiku evidentně špatnou metodiku a vycházím, že Seznam Podíl 10% Akorát, že když si vezmeš metodiku,
Minuta: 17
která je potištěna pravděpodobně chyb, které udělali tak vychází. Klidný číslo, vychází ti to, co jsem ti řekl 45% Já tu třicítku už bych tam asi neviděl, ale ty čísla jako já jsem je dneska viděl nějaký prezentaci od svého šéfa, jo, takže nevím, co z toho vlastně je veřejná informace, ale ta 25 kg a je tam rozhodně, kolik vývojář udělá na v Seznamu na vyhledávání, no já Pásková. A ne snad odpověď přesnou, ani rámcově bys neujel říct, jestli je to prostě lidí, nebo je to otázka. Co je to vývojář, jo? A vy jste to počítáš třeba devops, nebo vy světla počítáš ty anotátor i kterých a na toho výsledky a ten ten počet podle chce, přesto i s těma brigádníka a s takovými Jakými jinými třeba rozlišujeme vyhledávat vyhledávání
Minuta: 18
rozlišujeme vyhledávače organic už tam máme takovou podvezi, který říkáme organic má za úkol dávat těch 10 modrý chystat. Tak A to sis určitě všiml ten výsledek vyhledávání máme obklopený nebo nebo i přepsaný výsledky, který dělá podsekce, který říkáme vyhledávač, která tam dává chytří karty. Dává tam mapy předpovědi počasí a takovýhle dotazy, které je lepší odbavit nějakou jinou technologií, než furt textovem hledáním, ale takže zhruba takhle jsou ty čísla a teď máme vysoký počet otevřených pozic a je to tím, že prostě Našli jsme spoustu nebo já nevím, jestli to můžu říkat, že patřím do toho týmu, ale ale řekni mu, že představenstvo je densifique ovalo. Jaké další možnosti, co v tom vyhledávání dělat a teď by bylo fajn nabírat. No další další vývojáře. Tak
Minuta: 19
to je asi odpověď moc pěkná pro Honzu, protože nabíráte vývojáře a máte hromadu dalších nápadů, co s tím zadáváním ještě rozhodně ano věděla nápady se teda Otevřeli s novými technologiemi, které používáme. A jak ty jsou docela? My tomu říkáme vektorový hledání, což je veliká zkratka, ale když to zjednoduším tak minulých desetiletích se hledalo slovama, že uživatel napsal slova a ty se hledali findex jako slova a vrátili si nějaké dokumenty uživatelům kryty slova obsahovaly Vector v hledání je způsob, jak to slovo. Pojmout i uvnitř počítače jako představu. Matematické to Vektor třeba s těmi 256 čísly, a který na který když se podíváš tak nutně. Víš co, to je nějaký čísla, ale pro ten počítač a nebo 0-255, ale
Minuta: 20
pro ten počítač je to nějaká představa a ta představa je zajímavá ta v tom, že on umí to před tou porovnávacím a představami Cinema vektory a nad těmito navařit více než dva vektory, tak každý matematiky první co ho napadne, když dostanete chceš, tak atlety vektorový součin skalární součin, takže prostě uděláš skalární součin a vyjde ti číslo a to číslo ti vlastně v jádře podobnosti fakturu. To znamená, že když to byl mezi neruším uděláme Vektor z dotazů a vektor z dokumentu nějaký otisk vlastně vlastně uděláme součin. Tak my jsme jako uměli dělat Vektor z dokumentu už před 10 lety, že jo, jak zjistili na to latentní dirichletova analýza a podobné věci. Akorát jsem součin neměl vždycky ty vlastnosti, které jsme chtěli. Já teď tam jsou. Má tu vlastnost, že ne, když je vysokej. Tak se ten dotaz, co mu dokumentu podobá a samozřejmě kolem toho spousta další práci, jako že říci co budeme dělat. A na těch bude to celý dokument nebo jenom jeho části je hlavní index. A nebo to bude mít hlad titulků a tak dále. A teď
Minuta: 21
máš hrozný máš různé komponenty, které ti dělají traktory. Třeba je to to jsou normálně o prostor řešení, třeba je to Fast exp umí dobře dělá traktory z jednotlivých slov a pak máš něco čemu se říká Vectra Google na to používá technologií, který říká Birds ráno v tomto článku a ta Elektra umí udělat rektor celého segmentu, který věty nebo nějakého většího Kosu, tak si to Takže takže Jaké bude počasí v sobotu je tam jiný než už dotazů. Chci se podívat na Luďka Sobotu. A kdy ještě ten pátek to sobotu neumí rozlišit, že to si jako stejná sobota pro něj. A proto elektro, už je to i jiný jiná sobota, jinej sobota. Rozumím, já si to představuji jako nějaký právě otisk. Dává mi to potom si myslel, jak mě to vytáhl taky otiskneme to nějaké embedding. Hele, který vlastně typy dotazů to co člověk napíše
Minuta: 22
do vyhledávače, tak jsou pro vás úplně jako nejsložitější dlouhý dlouhý, jo. A čím delší tím horší hlavně takhle proto starý termo vyhledání byli dlouhý dotace těžký, protože v nich obvykle byly některé slova jaksi navíc. Například jak jak vybrat nejlepší ledničku do auta, jo, když se někdo zeptá takhle, tak vlastně už to jak vybrat tam tam bylo navíc. Nepotřebuješ vůbec jako a vlastně potřebuješ, aby byla nejlepší. No tak vlastně ne, že je to v tom dokumentu taky být nemusí. Takže byl vlastně těžké zjistit, které jsou v tom dotazy důležitý a byla to ta lednička auto a to jsou asi lidé, co píší i do toho vyhledávače dotazy, tak jakou jakoby se ptali člověk. No tak to jsem ti vysvětlil, že lidi se Přibývá jich na druhou stranu. Ale pokud já
Minuta: 23
napíšu nějakou konkrétní situaci to ještě s radostí uvozovkách, já to píšu, tak já si docela jednoduché ne, když prostě je nějaká konkrétní věc, na kterou jsem se někde zapamatovala. Chci najít ten styl jo, tak to je to relativně snadné a to se dobře hledá těma těma thermage. slova No nevím, protože asi nejsou těžké. Takhle se dobře hledají písničky. Ale běda ti když tam to slovíčko splete, ale taky se s tím Právě mi poradit a vyhledávat už vás obírali myslel tady to a když si takhle něco nechám vyhledat, tak ono mi to napíše často zobrazují 10 dotazů z pěti 1850000 výsledku. Takže to znamená, že reálně tam někde, že se hrazené 5000000 prostě stránek takhlenc byl 2 dny až po páté milion, co myslíš? No ta z ní je nejdražší operace, co se týká takových základních operací
Minuta: 24
s datama. A to znamená, že ne ne, že tam je seřazených těch posledních. Já nevím tisíc a zapne Google ti jich víc, než tisíc nedá, ani nevím kolik jich a seznam to, že mi tohle je nepřijde důležité, funguje to tak, že ty stejně nedokážeš prohledat ten Trinex Najednou najednou stroje. To znamená, že to máš na injekce rozmístěny po několika stovkách různých počítačů a když je tam ta báze těch stránek vlastně jakoby, které jsem ve kterých vyhledává. Asi ano, tomu říkáme jinde, protože ono to má ono to má strukturu toho. Čemu se v anglické literatuře konci stránky se tomu říká rejstřík, takže v tom intexu hledáš, takže když ti přijde dotaz, takhle pošleš na několik stovek počítačů, které každý má svůj čas indexu. Najde se v něm něco vrátí výsledky do nějaké komponenty, které třeba říkáme metasearch, která znova se řadí, ale pevné a tím, když se
Minuta: 25
hledej ty části stránek nad těch jednotlivých fajn Drive nebo PaySafe. Podle toho jakou použít terminologii, ta každé Kromě toho, že tě pošle pošle tu 10 z jeho nejlepších, tak ti pošle nějaké čísla, který říká kolik si myslíš, že jí tam celkem A tenhle co se kromě toho sezení, může zároveň si to číslo se číst. ale dost často, to jsou hausnumera, který vůbec nic nevyjadřuji, protože jak jsem už vysvětlil, tak občas ty slova musíš těch dotazů vyhazovat a samozřejmě, když máš krátký dotaz, tak je mnohem snažší na ni najít obrovskou spoustu dokumentů a teď když hledáme třeba ve vektorech a Je pravděpodobné, že Google taky už delší dobu hrát ve vektorech, tak tak najednou to slovo domu sloveso našlo. Už má úplně nejvíc nám dneska už Protože ty jak to v Prostory jsou jak mají třeba dc56 rozměru, tak se nedají prohledávat nějakém normálním intuitivním způsobem. Musíš na to použít pokročili algoritmy, které mají to zajímavou
Minuta: 26
vlastnost, že nejsou nejsou vždycky stejně stochastický lehce prostě v 99% teď je to vědí to samé. Ale pak se ti občas stane, že najdu něco jiného, takže nejsou deterministický Ten a tam vlastně už nehledáš něco, co má schodů, ale hráč něco, co je dostatečně blízko, takže vlastně záleží na mě, jak velikej uděláš kruh a ty moderní algoritmy na prohledávání televizích prostoru jsou postaveny na tom, že oni jí nezaručí, že se našel to co je nejblíž, ale ale zrušiti, že nějakým procesem došly dostatečně blízko. Já takže tam na jedno slovo našel je takový Lazy tam matematika zatím Jaká ještě k to popisuješ, tak to mě přijde fascinující teda a hezky. Nevím, jak tam jak
Minuta: 27
je důležité je pro vás jako čas v tomhle tom jako ten milisekundy. No jasně, no, když to trvá, než to trvá moc meleš kontakt. Tak to vypadá, že tyhle ty jsou pomalí. No i tak se zkusím zeptat, jaký typ dotazů, když bych dal tak ten je časově náročnější pro vás zase je to proto, že takhle u těch viktoru je to zase jinak tam už i ty dlouhé dotazy se zvládli dobře, ale když se vrátím k tomu starému ten mobil termo vím ranní, tak tam je samozřejmě problém udělat ty dlouhý dotazy, protože ty si musíš nějak e107 načíst do paměti. Dneska už teda ty paměti většinou jsou předem, ale ty musíš projít nějakým algoritmem. Nějakým procesorem a když máš dotaz, který obsahuje jedno slovo, tak prostě vezmeš ten hotový index a pošleš to na jistou, když máš Brod asi tak musíš dát průnik dvou, když máš 3D. Já jsem si řekl dotazy viď. Ale když máš No,
Minuta: 28
myslel jsem slova, když máš tři slova k dotazu. Tak už tady to musíš udělat průnik tří, když má čtyři už musíš dělat ze mě to ale museli jsme to nakonec udělat, takže tam máme víc fází, kdy na začátku v prvních několika milisekundách v hledáme vlastně jenom něco čemu říkáme kandidáty nad tím nepočítáme nic složitého. Vlastně nám zjišťujeme, jestli tam ty slova nebo vektory jsou a Robin. To znamená že nějaké že jsi nějak z toho řetězce dlouhého vyberete nějaké slovo, které Ne ne vlastně je napřed. Si uděláme evropskou množinu kandidátů v dokumentu o kterých víme, že jsou ve slově napovídající, že jsou kandidáti na to, že by mohly být dobré odpovědi nad nima skoro nic nepočítáme tam opravdu šetříme milisekundy a teprve když tyhlety seřadíme podle nějakých
Minuta: 29
nějaký základních Patrick, tak vezmeme prvních několik desítek stovek tisíc a teprve u nich počítáme nějaký složitější signály i větší v poště třeba, jak jsou ty slova blízko v tom dokumentu a pak ještě Jdeme dál a nějaký nějaký modely umělý tendenci vyhodnoceny zase jenom na prvních několika stovkách. Řekněme, že ty jsi takový početně nejdražší No. Napadá mě jak ten systém je vlastně složitý matematicky docela tak a jestli pořád Dneska se dá ten vyhledávač v uvozovkách hacknout. Tak třeba dříve bývaly. Říkalo se tomu Google bomby, jo, že jsi prostě To dělal přes zpětné odkazy v té době optimalizoval si vezmi tak aby když potom napíšeš nějaké ošklivé slovo, tak ti vyjel na prvním místě třeba nějaký politik. Dá se tohle to pořád dneska dělat. Dá se hacknout vyhledávač, ale asi jo asi jo. A vzhledem k tomu, že se
Minuta: 30
ty algoritmy mě něj pořád, tak asi ty způsoby jsou nové a nové a tak. On už to asi málokoho baví, že jo. Je to známá věc, tak proč by to lidi dělali a vlastně musíš být pořád o krok před tím vyhledávačem, že jo. Před chvílí to typická Červená královna, co to znamená by stál na místě, tak musíš běžet. Neboj se toho, že se dostaneme do stavu, kdy ta technologie nás vlastně ho Přerost a já jsem se že počítač nebudu potřebovat balit hezký holky a pronajímat si kanceláře, takže nebude mít žádný nebo tam vraždit. Hodně je válka vedena umělci, tak nás budou zavírat koncentráku od Šel by se dělat do Googlu, kdyby jsi dostal nabídku. Duklu podle mě levá ruka neví, co dělá pravá, zajímal by mě váš názor na kryptoměny. Já si myslím, že by Umění já vlastně jsem ne rád, že že by to neexistuje a že má tak vysokou hodnotu. Jaký je Dušan UV pohled na politiku piráti stan odeska topka, jako neumějí dělat politiku, že jediný, kdo to pochopil je prostě Andrej
Minuta: 31
Babiš a on ty volby vyhraje, jestli je pro tebe náročné žít mezi lidmi, kteří nemají takovou mozkovou a výpočetní kapacitu jako ty.

Předchozí video

Šídlo srovnává Českou televizi, Seznam zprávy a CNN Prima News (bonus z Patreonu)

Další video

Dostal jsem 200 bitcoinů, koupil jsem barák, auto a ještě mi zbylo, říká František Fuka