Projekt „Nový hledač“
Vysvětlení mého algoritmu hledání
Postup:
1.
Stahuji informace o všech komponentách WWW stránek (texty, obrázky, videa...).
2.
Z tohoto komplexu vytvořím matematickou konstrukcí jisté množiny = JINÉ OBJEKTY.
3.
Tyto JINÉ OBJEKTY hodnotím KVANTITATIVNĚ i KVALITATIVNĚ.
4.
Z tohoto hodnocení odvozuji pořadí WWW stránek (odkazů - linků) pro hledání.
Poznámky:
Pod pojmem klasický algoritmus hledání se skrývá přibližně toto:
1. Kolikrát se dané klíčové slovo vyskytuje na WWW stránce.
2. Velikost WWW stránky.
3. Počet odkazů z WWW stránky a na WWW stránku.
...
Těch kriterií (bodů) má algoritmus Google cca 108 (podle některých zmínek až 200).
V
každém bodě se vyskytuje pojem "WWW stránka", kterou tento
algoritmus hodnotí.
Mimoto se jedná pouze o rozvedení následujících 7mi kriterií: velikost stránky,
počet výskytů daného klíčového slova na stránce, linky ze stránky a na
stránku, WWW adresa (zda je to doména, pokud ne tak její úroveň, koncovka
domény, IP adresa, věhlas - Wikipedia apod., klíčová slova v adrese),
stáří stránky a domény, frekvence změn stránky, počet prokliků na stránku
z hledače.
Pod mým pojmem JINÉ OBJEKTY se skrývá termín na pomezí počítačů a Internetu,který je používán cca 20 let, s pevně definovaným obsahem.
Co jsem udělal:
Uvážil jsem klasický algoritmus hledání. Uvážil jsem termín JINÉ OBJEKTY. Propojil jsem to dohromady.
Jinak řečeno, do klasického algoritmu hledání jsem místo hodnocení "WWW stránek" dosadil hodnocení "jiných objektů".
Ještě jinak řečeno, podíval jsem se na hledání z jiného úhlu pohledu,než to dělají existující hledače (Google, Yahoo, Bing...).
Teďka to vypadá jednoduše, ale trvalo mi 3 roky, než jsem na to přišel.
Můžete si to představit tak, že do textového editoru (Word apod.) natáhnete textový popis klasického algoritmu hledání, a pak zvolíte funkci NAHRAĎ WWW stránka / jiný objekt.
V mém algoritmu hledání je cca 30 kriterií, aby se daly relativně rozumně optimalizovat váhy těchto kriterií.
Tady mam ješte malé, ale důležité dovysvětlení:
Při odpovědi hledače na daný dotaz mají být úplně nahoře relevantní odpovědi na ten dotaz, tedy VELKÉ a KVALITNÍ stránky, které dotazu odpovídají.
Teprve za nimi mohou být méně obecné stránky, ovšem pořád na dané téma.
Např. pro klíčové slovo "Mikulov" mají být vpředu obsáhlé a dobré KOMPLEXNÍ stránky o tom městě a okolí, které obsahují: památky, přírodu, služby, atrakce, pořádané akce ve městě - novinky, informace, fotky, audio, videa, články, blogy, diskuze...
Teprve pokud se takové stránky vyčerpají, mohou následovat méně obecné stránky,
např. o kompletním ubytování v Mikulove, všech restauracích apod.
Teprve pokud se i tyto stránky vyčerpají, mají následovat informace o jednotlivostech - Zámek Mikulov, Kozí Hrádek,Hotel Bonsai, Restaurace Pod radnicí, Vinný sklep U mušketýra atd.
Tohle je klíčové a doufám, že také srozumitelné.
Na tom je postaven můj algoritmus hledáni, právě takově pořadí, jaké jsem popsal, by měl dávat.