สิทธิบัตร Google Site Quality Score: วิธีที่กูเกิลวัดคุณภาพเว็บจากพฤติกรรมผู้ใช้

← กลับสู่คลังความรู้สิทธิบัตร Google Search Patents

หมายเลขสิทธิบัตร (Patent Number): US 9,031,929 B2 (Approved in 2015)
ชื่อทางวิศวกรรมสิทธิบัตร: Determining a quality score for a website
ชื่อภาษาไทยเชิงประยุกต์: ระบบคำนวณคะแนนคุณภาพโดยรวมจากปฏิสัมพันธ์ผู้ใช้ (Site Quality Score Index)
หมวดหมู่ทางเทคนิค: Site Quality & Brand Authority (ดัชนีคุณภาพเว็บไซต์และอิทธิพลของแบรนด์)
แหล่งอ้างอิงปฐมภูมิ (Primary Source): Google Patents Registry – US9031929B2

1. บทนำ: การสิ้นสุดยุคหน้าเว็บคุณภาพต่ำและการลอยนวลของสแปมทราฟฟิก

หนึ่งในความพยายามอันยาวนานของ Google คือการต่อสู้กับเว็บไซต์คุณภาพต่ำ (Low-quality websites) และเว็บฟาร์มคอนเทนต์ (Content Farms) ที่พยายามสร้างหน้าเว็บเพจนับหมื่นหน้าโดยคัดลอก คัดลอกแล้วสรุป หรือใช้ระบบสร้างคำอัตโนมัติเพื่อดักเก็บทราฟฟิกคีย์เวิร์ดทั่วไป (Generic Traffic)

วิศวกรค้นหาข้อมูลของ Google ตระหนักดีว่า สัญญาณทางเทคนิคแบบออนเพจ (On-page signals) สามารถปลอมแปลงได้ง่ายโดยสแปมเมอร์มืออาชีพ ดังนั้น Google จึงหันมาใช้กลไกการสแกนเชิงพฤติกรรมและการวิเคราะห์ปฏิกิริยาของผู้ใช้จริง (User Interaction Signals) เพื่อสร้างตัวชี้วัดความน่าเชื่อถือที่ไม่มีวันเลียนแบบได้

สิทธิบัตร US 9,031,929 B2 อธิบายถึงกลไกทางคณิตศาสตร์อย่างเป็นระบบในการคำนวณ “คะแนนคุณภาพระดับเว็บไซต์” (Site Quality Score) โดยประมวลผลข้อมูลเปรียบเทียบเชิงลึก (Ratio Analysis) ระหว่าง “จำนวนคำค้นหาแบรนด์และนำทางโดยตรง (Brand & Navigational Queries)” กับ “จำนวนยอดคลิกเข้าชมทั่วไป” ซึ่งเป็นที่มาของระบบประเมินความไว้วางใจระดับสากล

2. เจาะลึกสูตรการคำนวณคะแนนคุณภาพระดับโดเมน (Algorithmic Mathematical Formula)

ความพิเศษของสิทธิบัตรฉบับนี้คือการเปิดเผยสมการคณิตศาสตร์ที่ Google ใช้คำนวณคะแนน Site Quality Score โดยจำแนกองค์ประกอบและขั้นตอนการทำงานออกเป็น 4 เฟสหลักดังนี้:

graph TD
A[“1. นับยอดการค้นหาชื่อแบรนด์หรือนำทางโดยเฉพาะเจาะจง
(First Count: Unique Navigational Reference Queries)”] –> C[“3. คำนวณอัตราส่วนทางคณิตศาสตร์ตามสมการเฉพาะ
(Computing Quality Ratio with Threshold and Exponents)”] B[“2. นับยอดการคลิกเข้าชมหน้าเว็บทั่วไปหลังค้นหาคีย์เวิร์ด
(Second Count: Unique Search Clicks / Associated Queries)”] –> C
C –> D[“4. สรุปคะแนนภาพรวมเพื่อใช้ควบคุมอันดับเว็บทั้งหมด
(Site Quality Score Association and Final Score Modification)”]

เฟสที่ 1: การนับคำสืบค้นแบรนด์เฉพาะตัว (Branded/Navigational Queries – ตัวตั้ง)

ระบบจัดเก็บข้อมูลจะนับจำนวนครั้งของคำค้นหาที่ไม่ซ้ำกัน (Unique Queries) ที่กูเกิลประเมินว่าเป็นการค้นหาแบรนด์หรือนำทางตรงมายังเว็บไซต์นั้นโดยเฉพาะ (First Count: Branded Queries เช่น การพิมพ์ค้นหาคำว่า Warrior SEO)

เฟสที่ 2: การนับยอดคลิกเข้าชมทั่วไปที่เป็นผลจากการค้นหา (Associated Queries – ตัวหาร)

ระบบจะทำการนับยอดการค้นหาทั่วไปที่ไม่ซ้ำกัน ซึ่งผลลัพธ์ทำให้เกิด “การคลิกเลือกหน้าเว็บเป้าหมาย” (Second Count: Associated Clicks) เช่น ผู้ใช้ค้นหาคำทั่วไปว่า รับสอน SEO แล้วเลื่อนมากดคลิกที่เว็บ Warrior

เฟสที่ 3: การประมวลค่าอัตราส่วนความเชื่อมั่น (Computing the Quality Ratio)

นี่คือขั้นตอนทางคณิตศาสตร์ที่เป็นแกนหลักของสิทธิบัตร ระบบจะคำนวณหาอัตราส่วนระหว่าง ตัวตั้ง (เฟสที่ 1) และ ตัวหาร (เฟสที่ 2) โดยมีข้อกำหนดเงื่อนไขปรับสมดุล (Balance Conditions) สองประการ:
1. การหักค่าเกณฑ์คั่นต้น (Threshold Value Deduction): ตัวตั้งที่เป็นแบรนด์เซิร์ชจะถูกลบออกด้วยค่าเริ่มต้นคงที่จำนวนหนึ่งก่อนนำไปคำนวณ (Numerator based on First Count reduced by a threshold) เพื่อคัดกรองหรือป้องกันไม่ให้เว็บไซต์ใหม่ที่พยายามโกงยอดค้นหาแบรนด์ของตัวเองในปริมาณน้อยสอบผ่านเกณฑ์
2. การยกกำลังทศนิยมของตัวหาร (Exponential Fractional Denominator): ตัวหารที่เป็นยอดคลิกเข้าชมทั่วไปจะถูกนำไปยกกำลังที่มีค่าระหว่างศูนย์ถึงหนึ่ง ($0 < X < 1$) เช่น ยกกำลัง $0.5$ (Denominator raised to a power) เพื่อปรับสมดุลไม่ให้เว็บไซต์ขนาดใหญ่ที่มีทราฟฟิกทั่วไปปริมาณสูงมากๆ เสียเปรียบหรือถูกปรับลดคะแนนอย่างไม่เป็นธรรม

เฟสที่ 4: การสรุปคะแนนควบคุมอันดับภาพรวม (Site Quality Score Indexing)

คะแนนสัดส่วนสุดท้ายที่คำนวณได้จะได้รับการบันทึกเป็นคะแนนคุณภาพระดับโดเมน (Site Quality Score) เพื่อไปคูณปรับแต่งอันดับหน้าเพจปลายทางในระบบดัชนีต่อไป

3. ความเกี่ยวพันโดยตรงต่อระบบพฤติกรรมผู้ใช้และ Dwell Time ใน SEO ยุคใหม่

สมการคณิตศาสตร์ในสิทธิบัตร US 9,031,929 B2 สะท้อนถึงการตลาด SEO ยุคปัจจุบันอย่างมีนัยสำคัญ:

ปราบปรามเว็บ Unhelpful Content และสแปมข้อมูล:
หากเว็บไซต์ใดๆ พยายามทำเนื้อหาตอบสนองคีย์เวิร์ดขยะนับพันหน้า ทำให้ได้ยอดการคลิกเข้าชมทั่วไปในปริมาณสูงมาก (ตัวหารเฟส 2 สูง) แต่ไม่มีสัดส่วนคนพิมพ์ค้นหาแบรนด์เลย (ตัวตั้งเฟส 1 เป็นศูนย์หรือต่ำกว่าเกณฑ์ Threshold) ค่าสัดส่วนอัตราส่วนจะตกลงทันที ส่งผลให้โดเมนนั้นติดลบและถูกปรับลดอันดับเพจทั้งหมดลงพร้อมกัน
ปฏิสัมพันธ์พฤติกรรมบนหน้าเว็บ (User Engagement Metrics):
นอกจากปริมาณการค้นหาแบรนด์แล้ว Google ยังใช้ข้อมูลความพึงพอใจจริงของผู้ใช้มาประเมินร่วมด้วย เช่น การตรวจสอบการคลิกย้อนกลับทันที (Pogo-sticking) หากผู้ใช้กดเข้าไปแล้วกดย้อนกลับภายในเวลาไม่กี่วินาทีเพื่อหาผลลัพธ์อื่น ระบบจะประเมินว่าเนื้อหานั้นไม่มีประโยชน์และปรับลดตัวแปรคะแนนลงอย่างมีนัยสำคัญ

4. ข้อพิสูจน์ทางกฎหมายจากเอกสารสิทธิบัตร USPTO (Primary Source Verification)

นี่คือข้อถือสิทธิหลัก Claim 1 จากเอกสารสิทธิบัตรอย่างเป็นทางการ US 9,031,929 B2 ของกูเกิล:

“What is claimed is: 1. A method implemented by one or more computers, the method comprising:

determining a first count of unique queries, received by a search engine, that are categorized as referring to a particular site;

determining a second count of unique queries, received by the search engine, that are associated with the particular site, wherein a query is associated with the particular site when the query is followed by a user selection of a search result that (a) was presented, by the search engine, in response to the query and (b) identifies a resource in the particular site; and

determining a site quality score for the particular site including computing a ratio of a numerator based on the first count and a denominator based on the second count, wherein (i) the numerator is based on the first count reduced by a threshold value which is a predetermined threshold value, (ii) the denominator is based on the second count raised to a power that is greater than zero and less than one, or (iii) both.”

ความหมายเชิงเทคนิคของบทสิทธิบัตร:

first count of unique queries referring to a particular site: ยอดจำนวนคำค้นหาแบรนด์เฉพาะตัวของเว็บไซต์ที่เป็นตัวแปรบวก (Branded Search)
second count associated with the particular site: จำนวนทราฟฟิกคลิกออร์แกนิกทั่วไปหลังป้อนคำสืบค้นใดๆ
denominator raised to a power that is greater than zero and less than one: ตัวควบคุมทางคณิตศาสตร์ที่ยกระดับไม่ให้ปริมาณยอดสแกนคลิกทั่วไปเข้ามาทำลายความเสถียรของแบรนด์ธุรกิจขนาดใหญ่

5. คู่มือปฏิบัติการทางเทคนิคและการออกแบบ UI/UX เพื่อเพิ่ม Site Quality Score

เพื่อยกระดับคะแนนความน่าเชื่อถือและความลึกซึ้งของคะแนนสะสมภาพรวมเว็บไซต์:

ปรับปรุงดัชนีประสบการณ์ผู้ใช้ (Core Web Vitals & UX Optimization):
ความเร็วในการโหลดเพจ ประสบการณ์อ่านง่าย ไร้โฆษณาคุกคาม และ UI ที่มีระดับความสะอาดสูง จะช่วยเหนี่ยวรั้งให้ผู้ใช้อ่านข้อมูลนานขึ้น (Increase Dwell Time) และขจัดปัญหาอัตราการกดย้อนกลับทันที (Pogo-sticking Protection)
มุ่งเน้นการสร้าง Branded Search Campaign:
กระตุ้นให้ผู้ใช้นำชื่อเว็บไซต์หรือแบรนด์ไปพิมพ์ค้นหาร่วมกับหัวข้อความรู้ภายนอกระบบสม่ำเสมอ เช่น แนะนำในเอกสารคู่มือ หรือจัดทำโปรโมชันเฉพาะตัวแบรนด์เพื่อเติมตัวเลขในช่อง First Count ของสมการ
การควบคุมความเกี่ยวโยงของช่องทางเข้า (Organic Click Health Control):
หลีกเลี่ยงการใช้วิธีล่อลวงผู้ใช้ผ่านการเขียนพาดหัวหรือเนื้อหาที่ไม่มีประโยคสาระสำคัญจริง ซึ่งเมื่อผู้อ่านคลิกเข้ามาแล้วกดออกทันทีจะทำให้คะแนนความน่าเชื่อถือในสมการสถิติวิเคราะห์ของโดเมนติดลบรุนแรง

🔗 โครงข่ายความสัมพันธ์เชิงความหมาย (Semantic Links)

บทความเกี่ยวเนื่อง:
- วิเคราะห์สัมประสิทธิ์สถิติแบรนด์ในสิทธิบัตร Panda Quality Factor (US 8,682,892 B1)
- การประเมินโอกาสคลิกตามโครงสร้าง UI ใน Reasonable Surfer Model (US 8,117,209 B1)

บทความให้คำปรึกษาด้าน SEO & AI Search