Projekt „Nový hledač“

Jak jsem na to přišel aneb Historie mého vynálezu

Před cca 5 lety jsem se vrátil (hlavně ze zdravotních důvodů) z Kanady, s určitou nevelkou částkou v dolarech, a hledal jsem v České republice nový business pro mne. Jedna z věcí, která mne napadly, bylo spojení Internetu a turistiky na Jižní Moravě (Lednice a okolí). Internet jsem již tehdy dělal asi 10 let, po Jižní Moravě jsem se toulal asi 25 let. Padlo tedy rozhodnutí, že budu dělat Weby o Jižní Moravě a souvisejících tématech (víno, kocovina, lidová hudba apod.), firemní akce apod.

Na začátku jsem se samozřejmě rozhlížel, jak to na Internetu v těchto oblastech vypadá, jak si stojí konkurence, jaký je prostor se prosadit. Tedy jsem potřeboval hodně hledat na Internetu podle různých klíčových slov. A tehdy jsem zjistil, že to s kvalitou hledání na Internetu není zdaleka tak dobré, jak by to mělo být, a to včetně Google. Udělal jsem si malý soukromý odhad a zjistil jsem, že cca 30 procent WWW odkazů je v Google špatně umístěných. Tento odhad jsem později doplnil rozsáhlou statistikou na 100 klíčových slovech a tento odhad potvrdila po 4 letech také studie City Group.

Poté mne napadlo, že by se dalo hledání na Internetu zlepšit, vymyslet něco nového a lepšího, než používají stávající hledače (Google, Bing…). Konkrétně jsem si položil otázku, jak změnit, zlepšit stávající algoritmy hledání (tzv. klasický algoritmus). Nejprve jsem si prostudoval popis klasického algoritmu hledání (cca 108 kriterií), ale nic mne nenapadlo. Poté jsem postupně vytvořil 21 WWW serverů a vytipoval si cca 100 klíčových slov, obecných i konkrétních (cestování, turistika, víno, hudba, ženy, koně, vtipy, Lednice, Lednicko-valtický areál…). Pořadí podle těchto klíčových slov jsem sledoval na 6ti hledačích (Google, Yahoo, Live Search, Seznam, Centrum, Atlas). Nesledoval jsem jen moje WWW servery, ale celkem cca 1000 WWW stránek (výhodou u mých WWW serverů bylo to, že jsem mohl měnit jejich vlastnosti). Sledoval jsem změny pořadí na hledačích v souvislosti se změnami WWW stránek a snažil se přijít na to, čím to je, že je v hledačích velký počet stránek špatně umístěn. Celkový počet sledovaných WWW odkazů byl cca (klíčová slova krát WWW odkazy na první nalezené stránce krát počet hledačů) 100 x 10 x 6 = 6 tisíc. Po 3 roky jsem na nic nepřišel…

Až v okamžiku, kdy jsem to už vzdával, mne napadlo podívat se na hledání z jiného úhlu pohledu. Nejprve jsem zkusil absolutně preferovat jen 1 kriterium hledání, tedy velikost stránky. Ale to jsem vzápětí odmítl, neboť to by preferoval jen velké WWW stránky, tedy kvantitu před kvalitou. Naštěstí jsem tu myšlenku úplně nazavrhl a po cca 2 dnech mne napadlo, udělat z tohoto jednoho kriteria princip hledání a doplnit hodnocení kvantity také hodnocením kvality. To jsem vymyslel za další cca 2 dny. A další 2 dny mi trvalo vymyslet, jak tento nový princip hledání zařadit do všech kriterií hledání (do celého algoritmu). Tak jsem nový princip hledání vymyslel v 6ti dnech, po cca 3 letech neúspěšného přemýšlení.

 

Další rok mně trvalo vypracovat toto: kompletní algoritmus hledání (kriteria) včetně počátečních vah kriterií, algoritmus minihledače pro praktické ověření, metodu porovnání výsledků hledání různých hledačů, dokumentace a strategie projektu.


Projektu jsem tedy dosud věnoval cca 4 roky práce half time, které jsem si financoval. Nyní hledám investora či investory pro minihledač.