← กลับสู่คลังความรู้สิทธิบัตร Google Search Patents
- หมายเลขสิทธิบัตร (Patent Number): US 8,117,209 B1 (Approved in 2012)
- ชื่อทางวิศวกรรมสิทธิบัตร: Ranking documents based on user behavior and/or feature data
- ชื่อภาษาไทยเชิงประยุกต์: แบบจำลองความน่าจะเป็นในการคลิกลิงก์ (Reasonable Surfer Model)
- หมวดหมู่ทางเทคนิค: Link Analysis & Ranking (การวิเคราะห์ลิงก์และพลังการส่งผ่านคะแนน)
- แหล่งอ้างอิงปฐมภูมิ (Primary Source): Google Patents Registry – US8117209B1
1. บทนำ: การสิ้นสุดทฤษฎี PageRank ทรงกระบอกดั้งเดิมและวิวัฒนาการสู่แบบจำลองพฤติกรรมมนุษย์
ในระยะแรกเริ่มของการก่อตั้ง Google อัลกอริทึมการคำนวณอันดับจะอ้างอิงกับ PageRank เวอร์ชันแรก ซึ่งประมวลผลบนแนวคิด “Random Surfer Model” ทฤษฎีนี้มีพื้นฐานสมมติฐานว่าผู้เข้าชมเว็บไซต์จะมีพฤติกรรมสุ่มคลิกลิงก์ต่างๆ ในหน้าเว็บด้วยน้ำหนักคะแนนและความน่าจะเป็นที่เท่ากันทั้งหมด (เช่น หากหน้าเว็บหนึ่งมีลิงก์อยู่ 10 จุด พลัง PageRank ที่หน้าเว็บนั้นมีจะถูกเฉลี่ยแบ่งปันออกไปเป็นสัดส่วนเท่าๆ กันคือ ลิงก์ละ 10%)
ทว่า ในสภาวะแวดล้อมหน้าเว็บจริง พฤติกรรมของมนุษย์ไม่ได้เกิดจากการสุ่มอย่างสะเปะสะปะ มนุษย์ไม่มีทางคลิกลิงก์ “ข้อตกลงความเป็นส่วนตัว (Privacy Policy)” ในส่วนล่างสุดของเว็บ (Footer) ด้วยความสนใจเท่ากับลิงก์ “สั่งซื้อสินค้าโปรโมชัน” ในเนื้อความส่วนบนสุดของเอกสาร
เพื่อแก้ปัญหานี้ Google จึงได้คิดค้นและยื่นจดสิทธิบัตร US 8,117,209 B1 ภายใต้ชื่อ Reasonable Surfer Model เพื่อนำแนวคิดความน่าจะเป็นทางสถิติมาใช้ในการคำนวณ “น้ำหนักคะแนนพลังการส่งผ่านลิงก์” (Link Equity / Link Weight) ตามความเป็นจริงของโอกาสที่มนุษย์จะเลือกเปิดลิงก์นั้นๆ (Probability of Selection) โดยคำนวณจากคุณลักษณะทางกายภาพ (UI/UX Features) และโครงสร้างการจัดวางเป็นสำคัญ
2. อัลกอริทึม Reasonable Surfer ประมวลผลคะแนนลิงก์อย่างไร? (Algorithmic Framework)
กระบวนการประมวลผลเชิงระบบคำนวณค่าพลัง PageRank ยุคใหม่นี้ จะประเมินผ่านสัญญาณคุณสมบัติของลิงก์และข้อมูลความน่าจะเป็นทางสถิติดังต่อไปนี้:
A[“1. ดึงค่าคุณลักษณะทางกายภาพของลิงก์ย้อนกลับ
(Link Visual & Structural Feature Vectors)”] –> C[“3. ประมวลผลเข้ากับแบบจำลองความน่าจะเป็น
(Predictive Navigational Model)”] B[“2. รวบรวมข้อมูลสถิติปฏิสัมพันธ์จริงของผู้ใช้
(User Engagement & Click Probability Input)”] –> C
C –> D[“4. ปรับเปลี่ยนและส่งผ่านน้ำหนักค่า PageRank
(Customized Link Weighting and Score Modification)”]
เฟสที่ 1: การจำแนกเวกเตอร์คุณสมบัติทางกายภาพ (Feature Vectors Extraction)
บ็อทจำลองพฤติกรรมของ Google จะทำโครงสร้างสแกนหน้าเว็บและระบุค่าคุณลักษณะ (Features) ของลิงก์ย้อนกลับแต่ละตัวแปรอย่างเป็นอิสระ โดยไม่จำเป็นต้องรอให้ผู้ใช้งานมาคลิกจริง ตัวแปรคุณสมบัติที่ระบบวิเคราะห์มีดังนี้:
* ตำแหน่งการจัดวางลิงก์ภายใน (Internal Link Placement): ลิงก์ฝังอยู่ในเนื้อหาบทความหลักส่วนบน (In-Body Text), แถบนำทางดึงดูดสายตาด้านข้าง (Sidebar), หรือซ่อนอยู่ใต้แทรกเมนูท้ายหน้า (Footer) เพื่อคำนวณโอกาสที่ผู้ใช้จะคลิกจริงตามสัดส่วนเลย์เอาต์ ป้องกันการลดค่าคะแนน PageRank ของเพจปลายทาง
* ดีไซน์เชิงความเด่นชัด (Visual Clues): ขนาดฟอนต์ (Font Size) ของตัวอักษรลิงก์, สีของลิงก์ที่ตัดกับสีพื้นหลังของหน้าเอกสาร, สัญลักษณ์ประกอบ และลักษณะฟอนต์หนาหรือเอียง
* ความเกี่ยวดองของคำอธิบาย (Anchor Text Contextual Score): คำสืบค้นหรือข้อความที่ใช้เขียนลิงก์ (Anchor Text) มีความเกี่ยวโยงตามธรรมชาติกับบริบทข้อความและพจนานุกรมความหมายเชิงลึกลำดับย่อหน้ารอบด้านมากแค่ไหน
เฟสที่ 2: การเก็บสถิติและแบบจำลองพฤติกรรมจริง (User Interaction Signals)
ระบบเก็บสถิติการใช้งานจริงของผู้ใช้อินเทอร์เน็ตในการมีส่วนร่วมกับองค์ประกอบการดีไซน์ต่างๆ เพื่อป้อนเป็นฐานข้อมูลเปรียบเทียบในแบบจำลองทางคณิตศาสตร์
เฟสที่ 3: การประเมินค่าความน่าจะเป็นเชิงคาดการณ์ (Predictive Navigational Model)
ระบบจะทำการรวมข้อมูลในเฟสที่ 1 และ 2 เพื่อคำนวณหาค่าคะแนน “โอกาสการถูกคลิกจริง” (Probability of Selection) ของทุกลิงก์บนเอกสาร
เฟสที่ 4: การจัดสรรและส่งผ่านพลังคะแนนอันดับ (Link Weight Allocation)
ลิงก์ที่มีคะแนนโอกาสการคลิกสูง (เช่น ลิงก์ภายในเนื้อหากลางบทความส่วนบน) จะทำหน้าที่ส่งผ่านคะแนนพลัง PageRank ไปยังหน้าปลายทางได้เกือบ 100% ในขณะที่ลิงก์ที่มีค่าความน่าจะเป็นในการคลิกเป็นศูนย์หรือต่ำมาก (เช่น ลิงก์ใน Footer) จะแทบไม่ได้รับสิทธิ์ในการส่งต่อคะแนนพลังเลย แม้จะมีลิงก์ตรงเหมือนกันก็ตาม
3. ข้อพิสูจน์ทางกฎหมายจากเอกสารสิทธิบัตร USPTO (Primary Source Verification)
เพื่อให้เป็นข้อมูลหลักฐานอ้างอิงเชิงวิชาการตามระเบียบวิธี Fact-checking นี่คือข้อถือสิทธิหลัก Claim 1 ของสิทธิบัตร US 8,117,209 B1:
“What is claimed is: 1. A method implemented by one or more server devices, the method comprising:
- storing, in a memory associated with the one or more server devices, feature data associated with features of links within documents where the feature data specifies one or more values for at least some of the features, and where the features are independent of user behavior;
- generating, by the one or more server devices, feature vectors for the links based on the stored feature data;
- storing, in a memory associated with the one or more server devices, user behavior data associated with navigational actions performed by users with respect to the links within the documents;
- generating, by the one or more server devices, a model based on the stored feature vectors and the stored user behavior data, where the model relates the feature data of the links to a probability that a link will be selected by a user; and
- calculating, by at least one of the one or more server devices and based on the generated model, a probability that the particular link will be selected by the particular user.”
ความหมายถอดความเชิงวิศวกรรม:
- features of links within documents… independent of user behavior: รูปแบบสไตล์ชีต (CSS Styles) และตำแหน่งการจัดวางของลิงก์บนหน้าเอกสาร (เช่น สี ฟอนต์ พิกัดพิกเซล)
- Generating a model that relates the feature data to a probability: การสร้างสมการทำนายโอกาสการคลิกของสายตามนุษย์โดยใช้เวกเตอร์คุณสมบัติเป็นตัวแปรต้น
- Calculating a probability that the particular link will be selected: การประมวลค่าส่งออกเปรียบเทียบเชิงสถิติ เพื่อระบุค่าตัวคูณคะแนนการผ่านพลัง PageRank
4. คู่มือการตลาดแนวปฏิบัติในการออกแบบสถาปัตยกรรมลิงก์ภายในตามหลักสิทธิบัตร
แนวทางการทำ SEO ยุคใหม่เพื่อรักษาพลังความน่าเชื่อถือและการกระจายค่าพลังของคะแนนลิงก์ (Link Juice) ภายในโดเมนให้ประสบความสำเร็จสูงสุด มีดังนี้:
ก. การให้ความสำคัญกับ In-Body Contextual Links
ลิงก์ภายในตัวบทความที่เป็นเนื้อความหลัก โดยเฉพาะในระยะ 3 ย่อหน้าแรกของบทความ (In-Content Links) จะได้รับน้ำหนักคะแนนการส่งผ่านสูงสุดเนื่องจากมีโอกาสในการมองเห็นและกดใช้งานจริงสูงสุด ควรใช้อักษรลิงก์ที่เป็นข้อความอธิบายเจาะจง หลีกเลี่ยงคำว่า “คลิกที่นี่” หรือ “อ่านต่อ”
ข. การปรับลดความสำคัญของ Footer และ Sidebar Links
หลีกเลี่ยงการทำ “ลิงก์ชนกัน” หรือการยัดเยียดลิงก์นำทางจำนวนมากไว้ที่ Sidebar หรือ Footer ของหน้าเว็บ เนื่องจากแบบจำลองประเมินโอกาสคลิกของ Google จะมองว่าลิงก์ส่วนล่างสุดนี้แทบไม่มีโอกาสถูกคลิกจริง และจะลดทอนพลัง PageRank ปลายทางลงอย่างมาก
ค. ความเชื่อมโยงเชิงความหมายของ Anchor Text (Anchor Text Relevance)
คำศัพท์ที่เขียนข้อความลิงก์ต้องสอดคล้องเชิงความหมายและพจนานุกรมความหมาย (Contextual Semantics) กับประโยครอบข้าง เพื่อกระตุ้นให้ผู้สแกนข้อมูลมองเห็นความโปร่งใสและประโยชน์ของข้อมูล
ง. การป้องกันปัญหาคะแนนเฉลี่ยเป็นพิษ (Link Dilution Prevention)
ในหน้าเอกสารหนึ่งๆ ไม่ควรมีปริมาณลิงก์ภายในสะสมหนาแน่นเกินความจำเป็น เนื่องจากยิ่งในหน้านั้นมีลิงก์จำนวนมาก คะแนนโอกาสคลิกจะถูกเฉลี่ยแยกย่อยออกไปจนส่งผ่านน้ำหนักได้น้อยลง (Link Dilution) ควรเลือกส่งลิงก์ไปยังเพจหลักที่เป็นเป้าหมายสำคัญ (Hub Page) เท่านั้น
🔗 โครงข่ายความสัมพันธ์เชิงความหมาย (Semantic Links)
- บทความเกี่ยวเนื่อง:
- วิเคราะห์อัตราส่วนความเชื่อมั่นแบรนด์ในสิทธิบัตร Panda Quality Factor (US 8,682,892 B1)
- Second-Wave Validation และความสำคัญของ Schema Markup ใน AI Search (US 9,009,192 B1)

