Demo Site

Friday, April 8, 2011

Google දෙයියා වැඩ කරන හැටි(How Google Works)


මම කලින් Facebook වැඩ කරන හැටි කිව්වනේ. මේ කියන්න යන්නෙ FB එකටත් වඩා අපි කාටත් වැදගත් Google Search Engine එක ගැන. ලෝකෙ පුරා Search Engines අතරින් අංක එක ඒ කියන්නෙ 72% කට වඩා Google Search Engine එක තමයි පාවිච්චි කරන්නෙ.


ගොඩක් අයගෙ හෝම් පේජ් එකත් Google තමයි දාල ඇත්තෙ.
ඇත්තටම Google Search Engine වගේ ඒව නැති උනා නම් අපිට තොරතුරු හොයාගන්න විදියක් හිතාගන්නත් අමාරුයි.
සාමාන්‍යයෙන් Search Engine එකක් අන්තර්ජාලයෙ තොරතුරු හොයන්න භාවිතා කරන්නෙ විශේෂ algorithm එකක්.
මේ algorithm එක මත තමයි Search Engine එකක පැවැත්ම රඳා පවතින්නෙ. ඒ කියන්නෙ search result එකක නිවැරදිතාව, වේගවත්බව වගේ වැදගත් සාධක ඔක්කොම පාලනය කරන්නෙ මේ algorithm එකෙන්. සෑම Search Engine එකකටම එම ආයතනය විසින් දියුනු කරපු වගේම සැමවිටම update කරන specific algorithm එකක් තියනවා. Google Search Engine එකේ මේ algorithm එක සෑම විටම රහසක් විදියට තියාගන්න තමයි Google කට්ටිය උත්සාහ කරන්නෙ. මොකද අනිත් Search Engine එක්ක තරඟයක් තියන නිසා.

මම කියන්න යන්නෙ Google එකෙන් දැනට හෙළිකරල තියන තොරතුරු ටිකක්.
ගොඩක් Search Engine වගේ Google එකත් Keywords Indexing තාක්ෂණය තමයි පාවිච්චි කරන්නෙ. ඒ කියන්නෙ හරියට පටුනක් වගේ අදාල වචන(keywords) sort කරල ඒව තියෙන්නෙ කොතනද කියල සටහන් කරගෙන ඉන්නෙ(IT කරන කට්ටිය නම් indexing ගැන දන්නව).
මේ වචන අන්තරජාලයෙන් සොයාගන්න Google එක පාවිච්චි කරන්නෙ විශේෂ ප්‍රෝග්‍රෑම් එකක්. Search Engine Spiders හෝ Crawlers කියල තමයි මේවට කියන්නෙ. අපි හිතමු ඔයාල අලුත් වෙබ් සයිට් එකක් හදල ඒක හොස්ට් කලා කියල. ඊට පස්සෙ ඒක Google Search Engine results වලට ඇතුල් වෙන්න නම් එයාල දෙන විශේෂ code එකක් ඔයාලගෙ සයිට් එකට දාන්න ඕන(web කරන අය දන්නව Search Engine Optimization-SEO කිව්වම).
මෙන්න මෙහෙමයි ගූගල් එකට අපේ සයිට් එකතු කරන්නෙ.


ඊට පස්සෙ Search Engine Spiders ලා සයිට් එකට ඇවිල්ල මුළු සයිට් එකම පීරල ඒකෙ තියන keywords,links වගේ ඒව සේරම analyse කරල indexer එකට යවනව.
දැන් කවුරුහරි කෙනෙක් ඒ keyword එක search කලොත් ඔයාලගෙ සයිට් එකත් result වලට පෙන්නනව. හැබැයි ඒ results දහස් ගනනක් අතරින් එකක් විදියට. මුල් පිටුවට එන්නෙ ගොඩක්ම ජනප්‍රිය සයිට්. ඇත්තටම මේ Results වල අනුපිළිවෙල තෝරන්නෙත් algorithm එකකින්. මේ algorithm එකට කියන්නෙ PageRank කියල. හැම වෙබ් පිටුවකටම ස්කෝර් එකක් දෙනව සාධක කීපයක් පදනම් කරගෙන.
* The frequency and location of keywords within the Web page: If the keyword only appears once within the body of a page, it will receive a low score for that keyword.

* How long the Web page has existed: People create new Web pages every day, and not all of them stick around for long. Google places more value on pages with an established history.

* The number of other Web pages that link to the page in question: Google looks at how many Web pages link to a particular site to determine its relevance.

උදාහරණයක් විදියට wikipedia එකට ගොඩක් සයිට්ස් වලින් ලින්ක් වෙනවනම් විකිපීඩියා එකේ රෑන්ක් එක වැඩිවෙනව. ඒකියන්නෙ Results වල මුලටම එනව.

Google Indexer ගැන කතාකලොත් Search Engine Spiders ලා එවන text ඔක්කොම පිළිවෙලකට හදලා (sort) index database
එකේ තමයි ගබඩා කරල තියෙන්නෙ. search performance වැඩි කරන්න ඕන නිසා the, is, on, or, of, how, why වගේ වචන ඉලක්කම් වගේ ඒව ඉන්ඩෙක්ස් එකට ඇතුල් කරන්නෙ නෑ. ඒ වගේම සේරම අකුරු lowercase එකට හරවල තියෙන්නෙ.

මෙන්න මේ රූපෙ බැලුවම තේරෙවි.


ඒ වගේම Results වලට දකුණු පැත්තෙ ads දාල තියනව දැකල ඇති. මේ ඇඩ්ස් අහම්බෙන් එන ඒව නෙමෙයි. හැමතිස්සෙම අපි හොයන
දේට අදාල ඇඩ්ස් තමයි පෙන්නන්නෙ. තව ගොඩක් දේවල් නම් තියනව කියන්න. ඒත් කොටන්න ගියාම එපා වෙනව.
මෙන්න මේ වීඩියෝ එක බලන්න. ගූගල් ඉංජිනේරුවෙක් තමයි මේක පැහැදිලි කරන්නෙ.



ඔන්න ඕකයි සිද්ධිය

0 comments:

Post a Comment