cestovni-ruch.czCOT BusinessCOT mediaCZeCOT.infoWMP.czXMLevents

Hlavní stránka

Fulltextové CZeCOTí možnosti

E-mail
Neděle, 10 duben 2005

Každý měsíc na stránkách časopisu COT Business a odborně-profesního serveru www.cestovni-ruch.cz seznamujeme čtenáře s novinkami na turistickém serveru ČR www.CZeCOT.com. Tentokráte si přiblížíme fulltextovou funkci. Fulltext je na serveru k dispozici od samého spuštění, takže se nejedná až o takovou novinku, ale výrazně byly nově rozšířeny jeho možnosti. Ale pusťme se do toho po jednotlivých krocích.

Jistě každý internetový uživatel se jednou dostal do situace, kdy na vybrané webové stránce ne a ne najít tu informaci, o které ví, že tam je, ale neví kde. Postupně prochází celou strukturu webových stránek a hledá a hledá. Jen tak na okraj, já osobně tuto situaci nejčastěji řeším využitím vyhledávače Google, do kterého zadám hledané slovo s omezením hledání na vybranou doménu. Např. pokud bych hledal informace o Golfu na CZeCOTu tímto způsobem, zadal bych na stránce www.google.com hledaný řetězec s omezením ve tvaru "gofl site:czecot.com golf“.

Cílem našeho serveru je samozřejmě nabídnout návštěvníkovi takovou fulltextovou funkci, pomocí které nebude muset využívat externích systémů a po zadání slova Golf do okénka pro hledání nalezne hledanou stránku přímo v rámci serveru. V krátkosti bych rád uvedl několik výhod, které má czecotí fulltext oproti googlovému. Vcelku zásadní věcí je to, že si v rámci výsledku vyhledávání můžeme dle metodiky, kterou zvolíme, stanovit pořadí vyhledaných odkazů, což znamená mimo jiné významný marketingový nástroj. Neméně výraznou výhodou je skutečnost, že server dokáže vyhledávat s doplňováním a odstraňováním diakritických znamének, což umožní zahraničním návštěvníkům, kteří logicky nedisponují českou klávesnicí vyhledávat i bezdiakritické řetězce. Naprosto stejný výsledek tedy dostanete, pokud budete vyhledávat výraz „Polička“ stejně jako „Policka“. Jinak samozřejmostí je, že hledání vždy návštěvník provádí v jazykové mutaci, kterou právě používá. Pokud by měl zájem hledat i v jiných jazykových mutacích, musel by využít funkci tzv. rozšířeného fulltextu, o kterém si povíme více později. Další samozřejmostí je také tzv. substringové prohledávání, tzn. že server nalezne stránku se slovem „golfové hřiště“, pokud do jeho fulltextu zadám slovo „golf“. V současné době přemýšlíme i o možnosti, že by systém dokázal hledat řetězce, které by při hledání skloňoval a časoval (například tuto funkci nabízí vyhledávač Jyxo.cz ).

Abychom se však dostali k novince, kterou jsme avizovali v úvodu. V již předchozích článcích o CZeCOTu jsme vás informovali o tom, že v rámci informačního systému byl plně implementován Územní identifikační registr spravovaný Ministerstvem práce a sociálních věcí. Logicky to tedy znamená, že i ve fulltextu máte možnost vyhledání libovolné obce či části obce v České republice. Ve výsledku pak odklikem na nápis máte možnost zjistit bližší informace o dané obci (tedy do jakého kraje či turistického regionu a oblasti patří apod.) a dále pak klikem na mapičku, která je uvedena za názvem, ji zobrazit v mapovém systému a klikem na vlaječku pak detailní informace o dané obci či městu na portálu veřejné správy http://portal.gov.cz . Zde se dozvíte informace, jejichž sběrem a aktualizací se server nezabývá, tedy např. počet obyvatel, rok první zmínky o obci/městu, průměrný věk, nadmořskou výšku a dále pak všechny správní úřady s působností v dané obci/městu. Nezajímavé jsou také pak odkazy na další informační systémy státní správy, jako je např. IS Statistického úřadu, Informační systém území, Územní identifikační registr Ministerstva pro místní rozvoj, ze kterých pak odklikem se návštěvník dostane na příslušnou stránku města či obce na portálu Města a obce online. Jak je z popisu patrné, systém plně využívá interaktivity internetu jednoduše propojující pomocí jednotného identifikátoru různorodé informační systémy.

Tou novinkou, o které neustále mluvíme, je možnost vyhledávat obce nejen dle aktuálního (oficiálního) názvu, ale také dle jeho historického (původního) názvu, které postupně v rámci možností zadáváme do systému. Podobný výsledek hledání fulltextu (v sekci objektů) tedy obdržíte, pokud budete hledat „Polička“ nebo „Politschka“, což je původní německý název města. Kromě původních názvů systém dokáže také vyhledávat i objekty v obcích, u kterých se používají překlady názvu. Typickým příkladem je např. Praha či Brno. Tzn. že výsledek hledání objektů bude stejný, když zadáte Praha, Prag, Prague, Praga či Źpă„ă. Mimochodem v souvislosti se spuštěním ruské mutace serveru se v současné době zabýváme projektem automatické transkripce českého textu do azbuky tak, aby bylo možné hledat ve všech názvech objektů, měst a obcí jak v latince, tak v azbuce. Podobný problém s transkripcí je i v polštině.

Jak jsem již dříve uvedl, server také nabízí tzv. rozšířený fulltext, který umožňuje vyhledávání lépe zprecizovat. Hledání tedy můžete omezit jen např. na nadpisy článků, klíčová slova, na stránky s autorstvím jen některých osob, dle data aktualizace zadáním rozsahu od-do, jazykovými mutacemi a dále pak výběrem jednotlivých databází, kde se má vyhledávání provádět. Vzhledem k tomu, že server využívá množství externích databank, je na výsledku hledání možné ve fulltextovém vyhledávání pokračovat v dalších oblastech. Je samozřejmé, že snahou serveru je zakomponovat co možná největší počet těchto externích databank pod svá křídla tak, aby uživateli systému bylo umožněno co možná nejkomfortnější vyhledávání. Vše je logicky otázkou dalších prací na projektu a disponibilních financích na tento rozvoj.

Příjemné vyhledávání přeje a nejen na internetové setkání s Vámi se těší

Vít Pechanec
projektový manager turistického serveru ČR CZeCOT.com
 
< Předch.   Další >