Geçmişten Günümüze Arama Motorları… Ne? Nasıl?

Arama motorları (search engine), dünyadaki hemen hemen tüm web sitelerinin listelendiği, kategorilere ayrılmış, aradığımız bilgileri en kısa yoldan ve hızlı bir şekilde ulaşmamızı sağlayan web siteleridir. Kendisine gönderilen sorguları cevaplayabilmek için bir arama motoru internetteki bilgileri önceden “görmek” zorundadır. Başka bir deyişle bir arama motoru ancak daha önceden “gördüğü” ve “hatırlayabildiği” sayfaları size sunabilir. Daha önce görmediği, ya da görmüş olsa bile hatırlayamadığı sayfaları ise kullanıcılara sunamaz.

İlk arama motoru 1990 yılında bir üniversite öğrencisi olan Alan Emtage tarafından Archie adıyla kuruldu. İngilizce “archive” kelimesinden türemişti. Bu arama motoru insanların aradıkları dosyaları bulmaya çalışıyordu. Popüler olmaya başladığında Minnesota Üniversitesi’nden Mark P. McCahill, “www.archie.com”un karşısına 1991’de Veronica (Very Easy Rodent-Oriented Net-wide Index to Computerized Archives)’yı çıkardı. Çok geçmeden aynı amaçla Jughead (Jonzy’s Universal Gopher Hierarchy Excavation And Display) de kuruldu. İkisi de dosya aktarım iletişim kuralı çerçevesinde çalışıyordu. Haziran 1993’te Massachusetts Teknoloji Enstitüsü’nden Matthew Gray, bir indeks adı oluşturmak için kullanılan ve “Wandex” adıyla anılan ilk internet botunu üretti. Sonra Kasım 1993’te kurulan ve internet botu olmayan Aliweb arama motoru, web sitelerinin bilgilerini kullanarak oluşturulmuş ilk arama motoru oldu.  Aralık 1994’te web sayfalarını bulmak amacıyla kendi içerisinde dizin oluşturan ve tasarlanan sorgu programına arayüz ve bir web formu olarak kullanılabilen JumpStation arama motoru oluşturuldu. Bir ilk olan “tam metin”(full text) tarayıcı arama motoru olan WebCrawler, 1994 yılında görücüye çıktı. Önceki arama motorlarının aksine; herhangi bir web sayfasını, her kelimesi için herhangi bir kullanıcının aramasına izin veriliyordu. Ayrıca yine 1994 yılında Carnegie Mellon Üniversitesi’nden Dr. Michael Mauldini tarafından üretilip satışa çıkan Lycos, büyük bir ticari çaba oldu. Kısa bir süre sonra; Magellan, Excite, Infoseek, Inktomi, Northern Light ve Altavista dahil pek çok arama motoru internet ortamında görücüye çıktı ve popülerlik için birbiriyle yarıştı. Ancak bunların içinde bulunan, David Filo ve Jerry Yang’ın kurduğu Yahoo!, insanların ilgisini diğerlerinden çok çekerek web sayfaları bulmanın en popüler yolu olarak kullanılan arama motorları arasında yer aldı. Arama motorlarına 1990’ların sonlarına kadar büyük çapta bir yatırım yapılmadı. Ancak o yıllardan itibaren büyük şirketler ortaya çıkan bu yeni arama motorlarından kazanç elde etmeye başladı. 1998 yılında Google’ı kuran Larry Page ve Sergey Brin, PageRank adlı teknolojilerini satmak istediler ancak alıcı çıkmadı. İnternet ağındaki her sayfayı puanlayan bu sistem; o sayfaya ne kadar çok link verildiyse ve link veren yerlerin puanı ne kadar çoksa, söz konusu sayfaya da o kadar çok puan verme mantığına dayanıyordu. Google’ın sahipleri bu teknolojiyi satamayınca büyüme kararı aldılar ve 35 milyon dolar yatırım kredisi de alınca 1999’da Google Search‘i kurdular. 2000’li yıllarda öne çıkan Google arama motoru’nun ardından kısa sürede gelişip 2000 yılında Google Araç Çubuğu çıkaran ekip, 2004 yılında kütüphanelerdeki binlerce kitabı Google Book Search adıyla aramaya açtı ve 1 GB kapasite ile Google Mail yani Gmail hizmetini başlattı. Google 2007’in sonları itibariyle, en popüler web arama motoru olarak dünya çapında tanınıyordu.

Arama motorları 3 temel parçadan oluşur:

  • Spider: İlki “spider,bot,ant” gibi isimlere sahip olan programlar. Bu programlar interneti dolaşıp sayfaları tespit edip veritabanlarına kaydederler.
  • Veritabanı: Spider tarafından ziyaret edilen, her sayfanın kopyası burada saklanır. Sayfanızda yaptığınız değişiklikler, spider tekrar uğrayıncaya kadar arama motorlarında yer almaz. Arama yapıldığında, sayfanız veritabanındaki son haline göre değerlendirilip, sıralanır. Bu yüzden kullanıcılar, ölü linkler yada çok farklı içeriklerle karşılaşabilmektedir. Google.com’da “Önbellekten oku” komutuyla kayıtlı sayfanın Google’un veritabanındaki halini görebilirsiniz.
  • Sıralama mekanizması: Üçüncü parçada sıralama mekanizmasıdır. Kullanıcın yaptığı aramaya göre, en uygun şekilde sayfaları sıralamaya çalışır. Her arama motorunda bu parçalar farklı çalışır. Bazılarında, sayfanızda frame, image map kullanmanız sorun yaratabilir. Bazıları, veritabanına alt tag larını kaydetmez.

Her biri kendi yöntemini geliştirerek, ziyaretçilerine en iyi sonuçları getirmeye çalışır. Arama motorları, siteniz için önemliyse, kodlarınızı arama motorlarına uyumlu hale getirmeli, ve üst sıralarda yer alabilmek için, optimize etmeniz gerekmektedir.

Örümceklerin (Spider) Çalışma Prensibi

  • Bu örümcekler internet sitelerine girerler ve burada       olan bilgiyi hafızalarına alırlar.
  • Sitelerin meta etiketlerine bakıp sayfada bulunan diğer bağlantıları da ziyaret ederler.
  • Örümcek verileri merkezi bir depoya getirir.
  • Örümcekler düzenli olarak ziyaret ettiği  sitelere geri dönerler ve değişiklileri kaydederler.
  • Bir web sayfasına başka bir web sayfasından bağlantı verilmemişse örümcekler bu sayfayı bulamazlar.
  • Arama ölçütleri içerikle çakışırsa sayfa bulunur.

Robot internet üzerinde bulunan web sitelerini, sitelerin birbirlerine verdiği bağlantıları kullanarak otomatik olarak gezer ve bu sayfa içeriklerini saklar. Bu içerik daha sonra indekslenerek hızlı bir şekilde aranabilir hale getirilir. Kullanıcı arabirimi ise bu oluşturulan indeksin aranmasını sağlar.

Bazı Arama Motorlarına site sahipleri, sitelerinin var olduğunu bunlara kayıt yaparak bildiriler. Bu işlem, sitelerin arama motorlarında daha kolay bulunmasını ve indekslenmesini sağlar. Bunlara ek olarak İnternet’te milyonlarca Web sayfası içinde aranan bir bilgiyi bulmayı kolaylaştırmak için çok hızlı ve çok yüksek kapasiteli sunucularla Web sayfalarındaki metinleri endeksleyen servisler (Web siteleri) bulunur. Bunların arama dizini (directory), arama motoru (search engine) veya metasearch gibi farklı türleri olabilir. Arama dizini bilgileri kategoriler halinde sıralar, seçme bilgiler vardır, site sahiplerinin gönderdiği özet bilgi içinde arama yapılır. Arama motoru, aranan sözcükleri içermesi koşuluyla her tür siteyi kullanıcı karşısına getirir. Metasearch, birden fazla arama motorunda arama yapan sitelere verilen addır.

Bu arama sayfalarında, Arama (Search) satırına istenen bilgileri bulmakta kullanılacak kilit sözcükler girilerek ve Search (Ara) düğmesine tıklanılarak; bu sözcüklerin geçtiği Web sitelerinin adresleri liste halinde ekrana gelir. Ancak bu arama motorları da kullanıcı karşısına bu sözcüklerin geçtiği ilgili veya ilgisiz binlerce sayfa getirebilir.

Arama motoru teknolojisinde günümüzde genel amaçlı arama motorlarının yanında belli bir alana yoğunlaşmış arama motoru örnekleri türemektedir. Belli bir alana yoğunlaşmış arama teknolojisine dikey arama adı verilmektedir.

Arama motorlarının avantajları

  • Kompleks ve soyut anahtar kelimelerle arama çok uygundur.
  • Arama motoru üzerinde kullanıcı kontrolü vardır.
  • Aramalar, belli zaman aralığı,belli alan,belli bilgi kaynağı ile sınırlandırılabilirler.

Arama motorlarının dezavantajları

  • Zaman kaybına yol açabilirler.
  • Her arama motorunun kendine özgü teknikleri vardır.
  • Çalışmayan ve alakasız linklerle karşılaşılabilir.
  • Farklı arama motorlarında farklı sonuçların bulunması.

Arama motorlarının sınırlılıkları

  • Hiçbir arama motoru WEB in %40’ından fazla bir indekse sahip değildir.
  • Bilgiler her zaman güncel olmayabilir.
  • Arama motorları kelimenin yalın anlamı ile arama yapar.
  • Spesifik olmayan aramalarda çok sayıda sonuç listesi verirler.

Nasıl arama yapılır?

  • Konuyu en iyi tanımlayan anahtar sözcükler seçilmeli.
  • Aranan bir kelimeyse çift tırnak içine alınmalı.
  • Az ve spesifik kelimelerle arama yapılmalı.
  • İngilizcede  ‘the’ , ‘a’ , Türkçede ‘ve’ gibi kelimeler kullanılmamalı.
  • Çoğul kelimeler kullanılmamalı.
  • Küçük harflerle arama yapılmalı.

Arama parametreleri nelerdir?

Arama parametreleri, arama motorlarına göre zaman zaman değişkenlik içerse de, tüm arama motorlarında geçerli olan bir kaç parametre vardır. İşte bunlardan birkaçı:

+ parametresi
 “ve” anlamına gelir. Arama satırına web sayfası yerine web+sayfası yazarsak, arama motoru artık bize içinde sadece web sayfası geçen dokümanları listeleyecektir. Bu dokümanların içinde web kelimesi ortada sayfası kelimesi başta veya sonda olabilir. Bu işimizi biraz daha kolaylaştırmış olacaktır. Ama hala tam aradığımız doküman bu olmayabilir. O zaman da;

“” parametresini kullanmalıyız. Yani “web sayfası” yazıp aranmasını istediğimiz zaman, içinde sadece web ve sayfası yan yana geçen dokümanlar listelenecektir.

– parametresi arama motorunun arama satırına “web sayfası” – eğitim yazarak aramasını istediğimiz zaman, arama motoru, içinde web ve sayfası yan yana bulunan ama eğitim kelimesi içermeyen tüm dokümanları listeleyecektir.

Facebook Yorumları

İlk yorum yapan olun

Yorumunuz