گوگل پتنت

پتنت به معنی یک نوآوری یا ابداع است که حقوق و امتیازات آن به نام یک شرکت یا شخص ثبت شده است. گوگل پتنت‌ها شامل نوآوری‌هایی هستند که گوگل در یک زمینه خاصی ارائه داده و حقوق انحصاری آنها به او تعلق گرفته است.

بیل اسلاوسکی درباره یک گوگل پتنت نوشت که به نظر می‌رسید درباره آنچه در یک آپدیت اتفاق می‌افتاد توضیح می‌دهد (یک آپدیت مرتبط با حوزه پزشکی).

بیل گفت که محدوده فراتر از سایت‌های فقط پزشکی است. این پتنت نشان می‌دهد که چرا بعضی از سایت‌ها نمی‌توانند رتبه بگیرند.

هشداری درباره پتنت‌های گوگل

باید این را به خاطر بسپارید که گوگل معمولا تایید نمی‌کند که الگوریتمی که در یک پتنت توصیف شده را در حال حاضر استفاده می‌کند یا خیر. این پتنت ممکن است توسط گوگل استفاده شود یا نشود.

موضوع این پتنت گوگل (Google Patent) درباره چیست؟

این پتنت روشی را توصیف می‌کند برای کلاس‌بندی کوئری‌های جستجو و وب‌سایت‌ها بر اساس موضوعشان.

  • وب‌سایت‌ها بر اساس موضوعشان کلاس‌بندی می‌شوند.
  • کوئری‌های جستجو بر اساس موضوع یا عنوانشان کلاس‌‌بندی می‌شوند.

حوزه‌های دانش = موضوعات (عنوان‌ها)

در این پتنت، الگوریتم گوگل با چیزی به نام حوزه‌های دانش کار می‌کند که نشان‌‌‌دهنده موضوعات است. می‌توان گفت کوئری‌های جستجو و صفحات وب به حوزه‌های دانش خاصی تعلق دارند.

بیل حوزه‌های دانش را بدین شکل توصیف می‌کند:

کلمه “حوزه دانش” (Knowledge Domain) به موضوعاتی اشاره دارد که یک کوئری ممکن است درباره آنها باشد و به آنها مرتبط باشد. و ارجاعی به یک گراف دانش نیست.

و در مقاله خود اینطور بیان می‌کند:

کوئری‌های مربوط به حوزه‌های خاصی از دانش (که موضوعات خاصی را پوشش می‌دهند) نتایج را با استفاده از سایت‌هایی برمی‌گردانند که در کلاس‌‌‌‌‌بندی، در همان حوزه دانش قرار گرفته‌اند.

صفحات یک موضوع (Topic Pages)

یک راه برای ساده کردن این مفهوم این است که موضوعات را به شکل سطل یا Topic Bucket ببینیم. در یک Topic Bucket صفحاتی که در مورد اطلاعات پزشکی هستند وارد یک Bucket می‌شوند. صفحاتی که درباره درمان طبیعی هستند در یک سطل قرار می‌گیرند.

صفحات مرتبط با گوشی موبایل در یک سطل و صفحاتی که درمورد وکلای شخصی در یک شهر خاص هستند در یک سطل قرار می‌گیرند و الی آخر.

کوئری‌های یک موضوع (Topic Queries)

بر اساس این پتنت، کوئری‌های جستجو هم می‌توانند با یک Bucket که به آن تعلق دارند شناخته شوند. پس وقتی کسی “What Is Diabetes” را جستجو می‌کند گوگل می‌فهمد که این کوئری جستجو یک سوال پزشکی است نه یک سوال درباره درمان طبیعی.

موضوع یک سایت با موضوع یک کوئری باید در یک حوزه دانش و به هم مرتبط باشند تا تا بتوانند در نتایج جستجو رتبه بگیرند.

گوگل پتنت دسته‌بندی سایت‌ها و کوئری‌ها را تشریح می‌کند

این پتنت بدین شکل سیستم کلاسیفیکیشن (کلاس‌بندی) را توضیح می‌دهد:

کلاس‌بندی وب‌سایت‌ها

موتور جستجو داده‌های یک سیستم کلاس‌بندی سایت‌ها را برای تولید نتایج جستجو بکار می‌برد. برای مثال، سیستم کلاس‌بندی سایت‌ توضیحاتی را برای هرکدام از سایت‌ها تولید می‌کند و آن توضیحات را برای انجام یک کلاس‌بندی برای هرکدام از سایت‌ها بکار می‌برد.

کلاس‌بندی کوئری‌های جستجو

موتور جستجو یک کلاس‌بندی را برای یک کوئری جستجو بکار می‌برد تا یک دسته (Category) از سایت‌ها که دسته‌بندی مشابه یا یکسان دارند را انتخاب کند.

موتور جستجو نتایج را از روی دسته سایت‌هایی که انتخاب شده تعیین می‌کند.

خوشه‌بندی سایت‌ها

این پتنت یک فرایند را توضیح می‌دهد که سایت‌ها را با استفاده از گروه‌بندی سازماندهی می‌کند.

سیستم‌ها و متدهایی که در این داکیومنت تشریح شدند صفحات نتایج جستجو SERPs را که توسط یک سیستم جستجو تولید شده‌اند بهبود می‌بخشند. این کار را با شناسایی سایت‌هایی که در یک دسته خاص قرار دارند انجام می‌‌دهند.

سیستم کلاس‌بندی گروه‌هایی را براساس احتمال اینکه یک سایت تا چه حد قادر به پاسخگویی به یک کوئری است می‌سازد:

سیستم کلاس‌بندی سایت، کلاس‌ها را بر اساس قدرت پاسخگویی سایت‌هایی که در گروه‌های متناظر قرار دارند تعیین می‌کند.

مثلا، سایتی که در اولین گروه یا خوشه (Cluster) قرار دارد احتمالا توان بالاتری در پاسخگویی به کوئری‌های یک حوزه دانش خاص نسبت به سایت‌های گروه دوم یا خوشه دوم دارند.

سپس سناریوهایی را توصیف می‌کند که ممکن است از روی سایت رد شود و آن سایت کلاس‌بندی نشود.

چیزی که جالب است این است که در پتنت، به آنالیز Skipping اشاره می‌شود چون خوشه‌ای که یک سایت در آن قرار دارد از خوشه‌‌‌هایی که درباره یک موضوع وجود دارند خیلی دور است.

در بعضی پیاده‌سازی‌ها، یک یا بیشتر سایت‌هایی که در آموزش سیستم استفاده شده‌اند به هیچ کلاسی تعلق ندارند.

مثلا، وقتی نمایش یک سایت، از یک خوشه بیش از یک فاصله آستانه‌ای فاصله دارد، یا برعکس، اصلا در هیچ خوشه‌ای قرار ندارد، سیستم کلاس‌بندی سایت ممکن است با استفاده از نمایش وبسایت برای تولید یک نمایش مرکب تصمیم به رد شدن از روی آن بگیرد. مثلا ممکن است تصمیم بگیرد تحلیل‌های بیشتر سایت را در طول Training نادیده بگیرد.

معتبر بودن، خود یک دسته‌بندی است

هر سایتی در بین گروهی از سایت‌ها می‌تواند یک نمره یا امتیازی داشته باشد. این امتیاز کلاس سایت را نشان می‌دهد. مانند معتبر بودن، پاسخگو بودن برای یک حوزه خاصی از دانش، یا یک ویژگی دیگر وبسایت و یا ترکیبی از دو یا بیشتر این موارد.


پتنت گوگل فقط درباره سایت‌های پزشکی نیست

چیزی که باید بدانیم این است که فرایند توصیف شده در این پتنت در یک طیف گسترده‌ای از موضوعات و حوزه‌های کاری کاربرد دارد. این یک الگوریتم پزشکی نیست. بلکه خیلی بیشتر از یک پتنت مرتبط با حوزه پزشکی است.

به گفته بیل:

این پتنت نه فقط روی سایت‌های پزشکی بلکه روی سایر حوزه‌ها هم تمرکز کرده است.

این پتنت مثالی را شرح داد که بطور خاص درباره حوزه پزشکی بود. اما مشخص شد که به چندین صنعت مختلف مرتبط است.

کوئری‌ها نیز بر اساس حوزه دانش کلاس‌بندی شده بودند.

نکته: مفاهیم ضمنی رتبه‌بندی سایت‌ها

بخشی که در مورد کلاس‌بندی است به ویژگی‌هایی اشاره دارد مانند: معتبر بودن و فاصله از سایر خوشه‌‌‌‌های سایت.

یک معیار برای معتبر بودن، لینک‌ها هستند. و معمولا تحقیقات زیادی روی الگوریتم‌هایی که بر اساس موضوعات سایت‌ها را دسته‌بندی می‌کنند انجام شده است.

الگوریتم‌ها سایت‌های Seed را که نشان‌دهنده معتبرترین سایت در یک دسته موضوعات خاص است انتخاب می‌کنند. سپس سایر سایت‌ها بر اساس فاصله‌ای که از آن سایت‌ها دارند دسته‌بندی می‌شوند.

این الگوریتم یک سیستم مشابه را بکار می‌برد که در آن، سایتی که از سایر دسته‌ها فاصله دارد اساسا نادیده گرفته خواهد شد و در رتبه‌بندی سایت‌ها در نظر گرفته نمی‌شود.

اشاره‌ای به لینک‌ها در رابطه با استفاده از آنها بعنوان یک معیار اعتبار وجود ندارد.اما شباهت‌های بین الگوریتم‌های رتبه‌بندی سایت براساس فاصله لینک (که سایت‌ها را بر اساس موضوعات دسته‌بندی می‌کنند و دسته‌هایی از سایت‌ها را بر اساس موضوعات ایجاد می‌کنند) به نوعی مانند آیینه ای است که نشان می‌دهد چگونه این الگوریتم، کلاس‌بندی مشابهی را روی موضوعات محتوا انجام می‌دهد.

شاید خیلی هم غیرمنطقی نباشد اگر فکر کنیم این باعث قوت بخشیدن به تصورات رایج می‌شود و آنها را مهمتر می‌کند. اینکه بک‌لینک‌هایی که از صفحات مرتبط می‌آیند باعث بهبود رتبه می‌شوند.

توصیه: ریکاوری آپدیت گوگل

این بینش درباره الگوریتم گوگل، این طرز فکر را درباره ریکاوری آپدیت گوگل بطور کلی و بهبود آیدیت مربوط به بخش پزشکی بطور خاص تایید می‌کند

آپدیت به اصطلاح پزشکی به نظر می‌رسد کاملا درباره مسائل مرتبط باشد نه درباره سایر تخصص‌ها.

یکی از بینش‌های ‌کلیدی این پتنت این است که بهتر است به مسائل رتبه‌بندی از منظر مرتبط بودن نگاه کنیم. با توجه به تجربیاتی که در زمینه مشاوره به سایت‌هایی که رتبه خود را از دست داده‌اند داشتیم، اگر سایت شما بطرز فاجعه‌باری رتبه خود را از دست داده است احتمالا بخشی از این اتفاق مربوط به مسائلی است که در این پتنت توضیح داده شد.

اگر سایتتان فقط به اندازه چند جایگاه در یک صفحه جابجایی داشت (یعنی رتبه پایین‌تری گرفت) در اینصورت ممکن است مشکل از جای دیگری باشد مثلا افزایش رقابت یا افزایش مرتبط بودن.

ارسال یک پاسخ

آدرس ایمیل شما منتشر نخواهد شد.