Arama motorları, internetin sonsuzluğunda kaybolmadan istediğimiz bilgilere hızlı ve kolay bir şekilde ulaşmamızı sağlayan bilgisayar programlarına verilen addır. Arama motorunun kendisine gönderilen sorgulara cevap verebilmesi için önceden İnternet’teki bilgileri “görmesi” gerekir. Başka bir deyişle, arama motoru size yalnızca daha önce “görüntülediği” ve “hatırladığı” sayfaları sunabilir. Kullanıcılara daha önce görmedikleri veya görmüş olsalar bile hatırlayamadıkları sayfaları sunamaz. Ancak bir bilgisayar sayfaları nasıl görür ve hatırlar? İşte kapımızdan geçiyorsunuz.
İnternetteki sayfalar birbirine bağlantılar (bağlantılar) ile bağlanır. Bu sayede bir sayfadan diğerine geçiş yapılabilmektedir. Ayrıca, sayfalar genellikle kendileriyle ilgili sayfalara bağlantı verir. Örneğin, kalp cerrahisi ile ilgili bir Türkçe sayfada, hatta sitede kedi maması ile ilgili bir Fransızca sayfanın bağlantısını görmeniz pek olası değildir. İşte arama motorları bu özellikten yararlanarak bir siteden işe başlar ve internette gezinmeye başlar. Bir sayfa gördüklerinde, tıpkı bir kullanıcının Internet Explorer veya Firefox gibi bir tarayıcıyla yapacağı gibi, sayfaya bakar ve içeriğini anlamaya çalışırlar. Daha sonra içeriği hafızalarında bir yere (hard disk) yazarlar ve sayfadaki linkleri takip ederek diğer sayfalara geçerler ve orada da aynısını yaparlar. Böylece internette gezinirken olabildiğince çok siteyi ziyaret eder ve onları hatırlamaya çalışırlar.
Sayfaları hatırlamak esas olarak sayfadaki kelimeler sayesinde olur. “İndeks” adı verilen listelerde, bir kitabın başındaki içindekiler veya sonundaki dizin gibi kelimeleri sayfada tutarlar. Böylece gördükleri sayfadaki kelimeyi hatırlamaya çalışırlar. Daha gelişmiş arama motorları, bir sayfadaki kelimelerin sıklığını (sayısını), kelimelerin bir sayfadaki konumunu, birbirlerine göre konumlarını, bir sayfa içindeki harici bağlantılar için kullanılan kelimeleri, sayfa başlığını, bir sayfadaki başlıkları, yazılan kelimeleri kullanır. büyük ve küçük harfler, metin rengi boyutu, site genelinde yaygın olan kelime. Konu, sayfaya bağlantı veren diğer sayfaların içeriği, sayfanın bağlantı verdiği dış bağlantıların içeriği gibi birçok özelliğe dikkat eder ve bunları indekslerde saklar.
Bir sayfayı aynı tutmaktan ziyade indekslemenin amacı, gerektiğinde sayfadaki bilgilere kolay erişim sağlamaktır. Bir benzetme yapmak için, kitabın tamamına sahip olmamıza rağmen yine de içindekiler bölümüne ihtiyacımız var. Belirli bir kitapta bir konu ararken, önce bölüm başlıklarına, sayfa başlıklarına vb. bakarız. Ya da bizim için önemli olan bir kitapta başka bir kitaptan söz edildiğinde, bu kitap elimizdeyse onu ilgili bulur ve incelemeye çalışırız. Burada, arama motorları benzer bir fikri web sayfalarına ve web sitelerine uygular.
Kullanıcıdan bir sorgu geldiğinde, arama motorları hemen indekslerine bakar ve sorgudaki kelimeleri içeren sayfaları bulmaya çalışır. Daha sonra bu sayfaları farklı kriterlere göre sıralar ve sonuçları kullanıcıya gösterirler.
Tekrar özetlemek gerekirse arama motorları temel olarak üç kısımdan oluşmaktadır. Birinci kısım, İngilizce’de crawler (crawler) veya spider (örümcek) olarak adlandırılan, sayfaları tarayan ve içeriklerini toplayan kısımdır. İkinci modül, internetten toplanan sayfaların içeriğini tarayan ve indekslerde saklayan modüldür. Son bölüm olan sorgulama modülü ise ikinci bölümde oluşturulan indekslerdeki kullanıcı sorgularını bulur, kategorize eder ve kullanıcıya gösterir.
Diğer gönderilerimize göz at
[wpcin-random-posts]