Jak wyszukiwać informacje w Internecie

Internet sprawił, że z domowych pieleszy możemy uzyskać błyskawiczny dostęp do wszelkich możliwych informacji. Oczywiście pod warunkiem, że umiemy je znaleźć.

Internet jest tworem chaotycznym. Choć wielu porównuje go do ogólnoświatowej biblioteki, tak naprawdę jednak nie ma z nią nic wspólnego. W bibliotece książki są uporządkowane według przemyślanych i spójnych kryteriów. W Internecie jest dokładnie na odwrót. Gdy myślę o właściwej metaforze struktury informacyjnej Internetu, przychodzi mi na myśl magazyn przy papierni, w którym przechowuje się makulaturę. Większość druków to śmieci, są jednak wśród nich perełki, rzeczy, które warto przeczytać. Jak mamy szczęście, znajdziemy coś ciekawego, innym razem poszukiwania będą bezowocne. Zawartość magazynu cały czas się zmienia. Część rzeczy trafia na przemiał, w tym samym czasie ciężarówki dowożą nowe transporty makulatury. Sieć, mimo pewnych podobieństw, ma nad magazynem fundamentalną przewagę – wyszukiwarki, które indeksują bałagan i tworzą przyjazny interfejs do jego przeczesywania.

STRATEGIA: JAK SZUKAĆ, BY ZNALEŹĆ?

Pierwszą decyzją, jaką musimy podjąć, będzie wybór wyszukiwarki. Jest to bardzo ważne, gdyż od tego zależy skuteczność znajdowania informacji. Którą wyszukiwarkę wybrać? Nowoczesne wyszukiwarki zarówno ogólnoświatowe (Google.com, Yahoo.com, MSN. com), jak i polskie (Netsprint.pl, Onet.pl) są wystarczająco sprawne, abyśmy mogli z ich pomocą znaleźć niezbędne informacje w Internecie. Z wymienionych serwisów zarówno pod względem trafności wyników, jak i wygody na pierwsze miejsce wysuwa się Google. Sprawdza się on perfekcyjnie w przeszukiwaniu informacji typowo polskich, a także stron obcojęzycznych. Dwie największe wyszukiwarki polskie, Netsprint.pl (dostępna m.in. na Wp.pl) oraz Onet.pl, starają się rywalizować ze światowymi potentatami na własnym podwórku; indeksują wyłącznie strony polskie. Niestety, jak wykazały testy przeprowadzone w redakcji, mechanizm wyboru stron do zindeksowania jest niedoskonały i pomija wiele witryn w naszym języku. Przykładem tego błędu mogą być informacje opublikowane w polskojęzycznych blogach w serwisie Blogger.com. W Netsprincie i Onecie ich nie znajdziemy. Dla porównania, Google, gdy ograniczymy wyszukiwanie do stron polskich, bez problemu te teksty wyłapuje, podobnie jak inne polskie teksty na zagranicznych WWW. Z rodzimych serwisów najkorzystniej wypada Netsprint.pl. Jego mechanizm wyszukiwania, po modernizacji przeprowadzonej jesienią 2005 roku, daje bardzo trafne wyniki. Zmiany polegały na dodaniu nowego kryterium sortowania stron. Teraz oprócz analizy występowania słów kluczowych i liczby linków do danej strony, wpływ ma ocena popularności danej strony wśród polskich internautów, na podstawie badania Gemius Megapanel. Piętą achillesową Nestsprinta jest to, że znacznie rzadziej niż Google czy MSN. com indeksuje treść stron. Wyszukiwarki zachodnie wracają do indeksowanej strony co 2–3 dni. Netsprint robi to co kilkanaście dni, za wyjątkiem najpopularniejszych stron, które indeksuje częściej. Wyszukiwarka portalu Onet wypada jeszcze słabiej niż Netsprint. Paradoksem jest to, że z polskimi stronami znacznie lepiej, radzi sobie Yahoo Search, który w Onecie jest ustawiony jako wyszukiwarka stron zagranicznych. Jakość Google jest doceniana przez internautów, którzy wyklikali mu 2. miejsce wśród witryn w polskim Internecie (według PBI/Gemius za sierpień 2005). Używa go 6,5 mln Polaków.

Jak pytać?

Żeby znaleźć, przede wszystkim trzeba wiedzieć, czego szukać. To znaczy, trzeba mieć elementarną wiedzę na dany temat. Jest to niezbędne z dwóch powodów. Po pierwsze, jeśli kompletnie nie będziemy wiedzieli, o co chodzi, nie zdołamy sformułować pytania, które zaprowadzi nas do właściwej strony. Jeśli np. chcemy kupić samochód, musimy znać marki producentów, wiedzieć coś o wyposażeniu, silniku itd. Wpisanie „samochód” do Google, nie przybliży nas do znalezienia oferty, gdyż ilość wyników będzie olbrzymia, a większość z nich nie na temat. Po drugie wiedza jest konieczna do wstępnej oceny wiarygodności znalezionej witryny. Pamiętajmy, że korzystając z Sieci, jesteśmy zdani w tej materii wyłącznie na siebie. Jeśli źle ocenimy wiarygodność informacji, możemy wziąć dyletanckie bzdury za fachową poradę i roznosić je dalej. Dlatego, zanim przystąpimy do wyszukiwania szczegółów, zapoznajmy się z wortalem tematycznym. Znajdziemy go w wyszukiwarce (stosunkowo łatwo) albo w jednym z katalogów stron WWW (np. http://katalog.onet.pl, lub http:// dmoz.org/. Kiedy już mamy pewną wiedzę, przystępujemy do wyszukiwania konkretów. Generalną zasadą poszukiwania w Internecie jest maksymalne zawężanie pytań. Zadawanie pytań ogólnych, typu „aparat cyfrowy” mija się z celem, gdyż na liście wyników znajdziemy miliony trafień. W przypadku przytoczonego terminu aż 1 840 000. Gdy pytanie sformułujemy precyzyjnie, np. Sony DSC V1 Test, zakładając, że chcemy dowiedzieć się czegoś bliższego o tym modelu aparatu, uzyskamy adekwatne informacje. Dobre zapytanie do wyszukiwarki powinno składać się z kilku słów (min. trzech). Jeśli takie pytanie nie przyniesie pożądanego efektu, jedynym sposobem na zawężenie listy trafień jest użycie operatorów logicznych (szczegóły w dalszej części), dzięki którym możemy określić, w jakich zależnościach mają pozostawać poszukiwane słowa kluczowe.

Jak wybierać z wyników?

Mimo imponującego postępu, jaki się dokonał w dziedzinie wyszukiwania, nie zawsze strona, której potrzebujemy, znajdzie się na pierwszym miejscu listy wyników. Zarówno Google, jak i inne wyszukiwarki, jest podatny na „optymalizację”, czyli sztuczne podbijanie pozycji stron. Im większe pieniądze wiążą się z danym słowem kluczowym, tym większe prawdopodobieństwo, że na pierwszym miejscu znajdzie się wyszukiwarkowy spam.

JAK INTERPRETOWAĆ WYNIKI WYSZUKIWANIA GOOGLE? DEFINIUJEMY ZŁOŻONE ZAPYTANIA ZA POMOCĄ FORMULARZA ZAAWANSOWANEGO SZUKANIA

Przykładowowe wyszukiwanie gdy potrzebujemy darmowych sms: darmowa bramka sms 

To pole działa jak wyszukiwarka na stronie głównej. Google zwróci strony, które zawierają wszystkie wymienione terminy. 2 Tutaj możemy określić, ile trafień ma zostać pokazanych na każdej stronie z wynikami. 3 W tym polu możemy wpisać frazę, czyli ciąg słów, które na stronie, jaką spodziewamy się znaleźć, powinny być ułożone w identycznej kolejności. Przydaje się np. do szukania nazwisk. 4 W tym polu wpisujemy słowa, z których przynajmniej jedno powinno znaleźć się na stronie, której szukamy. W praktyce wpisujemy tutaj np. marki produktów. 5 W tym polu wpisujemy słowa, które nie powinny znaleźć się na stronie, jakiej szukamy, np. marki aparatów, które nas nie interesują. 6 Tutaj określamy język poszukiwanej strony WWW. 7 Możemy także określić format pliku, jakiego szukamy. Domyślnie Google przeszukuje wszystkie typy indeksowanych plików. 8 Tutaj możemy określić wiek danej strony, np. żeby recenzja, której szukamy, nie była stara. Niestety, mechanizm nie sprawdza się w wypadku stron generowanych dynamicznie. 1 Liczba trafień, czyli stron, które zawierają dane słowa kluczowe. 2 Odnośnik do strony WWW wyszukanej przez Google. 3 Kontekst, w którym na stronie występują słowa kluczowe. 5 Dzień, w którym ostatni raz indeksował daną stronę. 6 Po kliknięciu w ten link, będziemy mogli zobaczyć kopię strony z podświetlonymi miejscami, gdzie występują słowa kluczowe. 7 Tutaj znajdziemy odnośniki do stron o podobnej treści. 4 URL znalezionej strony. 1 2 3 4 5 6 7 Na co zatem powinniśmy zwracać uwagę, gdy analizujemy trafienia? Przede wszystkim na adres strony. Jeśli orientujemy się, jak wygląda „rynek” serwisów tematycznych na dany temat, na podstawie samej nazwy będziemy mogli zorientować się, jakiego rodzaju informacji możemy się spodziewać się na danej stronie. Następnie powinniśmy spojrzeć na fragment tekstu, który znajduje się poniżej linku z trafieniem, pokazuje on, w jakim kontekście znajdują się wpisane słowa kluczowe. Na tej podstawie możemy ocenić, czy mamy do czynienia z wartościową stroną, czy ze spamem. Spam zwiastują m.in. nazwy domen złożone ze słów kluczowych wyszukiwania albo wielokrotnie powtórzony termin, wreszcie nasze słowo kluczowe położone wśród wielu synonimów lub słów o pokrewnym znaczeniu. Często, żeby znaleźć pożądaną informację, będziemy musieli wchodzić na dziesiątki stron z listy wyników. Jeśli chcemy szybko sprawdzić, jak wygląda rozkład słów kluczowych na stronie, kliknijmy w link Kopia. Spowoduje to wczytanie cache’u strony z serwera Google, na której wszystkie słowa kluczowe będą podświetlone osobnymi kolorami. Żeby poszukać zbliżonych tematycznie stron, można kliknąć w link Podobne strony. Działa on dobrze, przede wszystkim gdy zapytamy o link do głównej strony serwisu. Ponieważ w wynikach mamy głównie odnośniki do podstron, wpiszmy w Google zapytanie „related:www.adresstrony.pl”. Dostaniemy wówczas listę witryn o podobnej treści. Wybieranie właściwej strony z listy wyników jest najtrudniejszą sprawą w wyszukiwaniu. Umiejętność szybkiego dokonania właściwego wyboru przychodzi z czasem i doświadczeniem. Nauczyć się można natomiast, i to stosunkowo szybko, korzystania z udogodnień oferowanych przez Google, które pozwalają bardziej prezyzyjnie zadawać pytanie.

TAKTYKA: GOOGLE W MAŁYM PALCU Tylko nieliczni z nas potrafią w pełni okiełznać moc Google. Sztuczki pokazujące, jak zadawać pytania, żeby wycisnąć z Google informacje, których nie spodziewalibyśmy się tam znaleźć, znajdziemy na stronie http://johnny.ihackstuff.com/. Przeciętny użytkownik nie potrzebuje tak dogłębnej wiedzy o mechanizmie wyszukiwarki. Wystarczy to, o czym piszemy poniżej.

Ten wpis został opublikowany w kategorii Bez kategorii. Dodaj zakładkę do bezpośredniego odnośnika.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *