Projekt „Nový hledač“
Jak jsem na to přišel aneb Historie mého vynálezu
Před
cca 5 lety jsem se vrátil (hlavně ze zdravotních důvodů) z Kanady,
s určitou nevelkou částkou v dolarech, a hledal jsem v České
republice nový business pro mne. Jedna z věcí, která mne napadly, bylo
spojení Internetu a turistiky na Jižní Moravě (Lednice a okolí). Internet jsem
již tehdy dělal asi 10 let, po Jižní Moravě jsem se toulal asi 25 let. Padlo
tedy rozhodnutí, že budu dělat Weby o Jižní Moravě a souvisejících tématech
(víno, kocovina, lidová hudba apod.), firemní akce apod.
Na začátku jsem se samozřejmě rozhlížel, jak to na Internetu v těchto
oblastech vypadá, jak si stojí konkurence, jaký je prostor se prosadit. Tedy
jsem potřeboval hodně hledat na Internetu podle různých klíčových slov. A tehdy
jsem zjistil, že to s kvalitou hledání na Internetu není zdaleka tak
dobré, jak by to mělo být, a to včetně Google. Udělal jsem si malý soukromý
odhad a zjistil jsem, že cca 30 procent WWW odkazů je v Google špatně
umístěných. Tento odhad jsem později doplnil rozsáhlou statistikou na 100
klíčových slovech a tento odhad potvrdila po 4 letech také studie City Group.
Poté mne napadlo, že by se dalo hledání na Internetu zlepšit, vymyslet něco
nového a lepšího, než používají stávající hledače (Google, Bing…). Konkrétně
jsem si položil otázku, jak změnit, zlepšit stávající algoritmy hledání (tzv.
klasický algoritmus). Nejprve jsem si prostudoval popis klasického algoritmu
hledání (cca 108 kriterií), ale nic mne nenapadlo. Poté jsem postupně vytvořil
21 WWW serverů a vytipoval si cca 100 klíčových slov, obecných i konkrétních
(cestování, turistika, víno, hudba, ženy, koně, vtipy, Lednice,
Lednicko-valtický areál…). Pořadí podle těchto klíčových slov jsem sledoval na
6ti hledačích (Google, Yahoo, Live Search, Seznam, Centrum, Atlas). Nesledoval
jsem jen moje WWW servery, ale celkem cca 1000 WWW stránek (výhodou u mých WWW
serverů bylo to, že jsem mohl měnit jejich vlastnosti). Sledoval jsem změny
pořadí na hledačích v souvislosti se změnami WWW stránek a snažil se
přijít na to, čím to je, že je v hledačích velký počet stránek špatně
umístěn. Celkový počet sledovaných WWW odkazů byl cca (klíčová slova krát WWW
odkazy na první nalezené stránce krát počet hledačů) 100 x 10 x 6 = 6 tisíc. Po
3 roky jsem na nic nepřišel…
Až v okamžiku, kdy jsem to už vzdával, mne napadlo podívat se na hledání
z jiného úhlu pohledu. Nejprve jsem zkusil absolutně preferovat jen 1
kriterium hledání, tedy velikost stránky. Ale to jsem vzápětí odmítl, neboť to
by preferoval jen velké WWW stránky, tedy kvantitu před kvalitou. Naštěstí jsem
tu myšlenku úplně nazavrhl a po cca 2 dnech mne napadlo, udělat z tohoto
jednoho kriteria princip hledání a doplnit hodnocení kvantity také hodnocením
kvality. To jsem vymyslel za další cca 2 dny. A další 2 dny mi trvalo vymyslet,
jak tento nový princip hledání zařadit do všech kriterií hledání (do celého
algoritmu). Tak jsem nový princip hledání vymyslel v 6ti dnech, po cca 3
letech neúspěšného přemýšlení.
Další rok mně trvalo vypracovat toto: kompletní algoritmus hledání (kriteria) včetně počátečních vah kriterií, algoritmus minihledače pro praktické ověření, metodu porovnání výsledků hledání různých hledačů, dokumentace a strategie projektu.
Projektu jsem tedy dosud věnoval cca 4 roky práce half time, které jsem si
financoval. Nyní hledám investora či investory pro minihledač.