محتوای تکراری چیست؟ – تاثیر محتوای تکراری بر سئو

در بخش‌های قبلی دوره آموزش سئو درباره بهینه‌سازی محتوا صحبت کردیم. یکی از نکات مهم در بهینه‌سازی محتوا، جلوگیری از تولید محتوای تکراری یا محتوای کپی‌شده است. بخاطر تاثیر محتوای تکراری بر سئو سایت، باید در تولید محتوا دقت کنید و از ایجاد محتوای تکراری جلوگیری نمایید.

Duplicate Content یا محتوای تکراری چیست؟

محتوای تکراری (Duplicate Content) یا محتوای کپی‌شده محتوایی است که مشابه یا کپی دقیق محتواهایی در سایر وبسایت‌ها یا صفحات دیگر همان سایت باشد.

وجود محتوای تکراری زیاد در یک وب‌سایت، می‌تواند تاثیر منفی در رتبه‌بندی آن سایت در گوگل داشته باشد.

بعبارتی دیگر محتوای تکراری محتوایی است که کلمه به کلمه آن عینا در یک صفحه دیگر تکرار شده باشد.

محتوای تکراری از نوع کپی شده
محتوای تکراری از نوع دقیقا کپی شده (محتوای کپی‌شده)

به محتوایی که مشابه یک محتوای دیگر باشد (حتی اگر بازنویسی شده باشد) نیز محتوای تکراری می‌گویند.

محتوای تکراری از نوع مشابه
محتوای تکراری بازنویسی‌شده (محتوای مشابه)

تاثیر محتوای تکراری بر سئو سایت چیست؟

بطور کلی، گوگل تمایل ندارد که صفحات دارای محتوای تکراری را رتبه‌بندی کند. در واقع، گوگل می‌گوید:

“گوگل شدیدا سعی دارد تا صفحاتی را ایندکس کند و به کاربر نمایش دهد که اطلاعات متمایزی داشته باشند.”

پس اگر صفحاتی روی سایتتان داشته باشید که اطلاعات متمایزی نداشته باشند (یعنی محتوای متمایزی نداشته باشند)، این مساله تاثیر منفی روی رتبه شما در صفحات نتایج جستجو SERPs که توسط موتور جستجو نمایش داده می‌شود خواهد داشت.

مشکلاتی که از داشتن محتوای تکراری زیاد ناشی می‌شود

در اینجا سه مساله اصلی را برای شما تشریح می‌کنیم که سایت‌های دارای محتوای تکراری زیاد با آنها مواجه هستند.

ترافیک طبیعی کمتر

این یک مساله کاملا بدیهی است. گفتیم که گوگل نمی‌خواهد صفحاتی را که محتوای صفحات ایندکس‌شده گوگل (شامل صفحات سایت شما هم می‌شود) را کپی می‌کنند رتبه‌بندی کند. برای مثال فرض کنید سه صفحه با محتوای مشابه روی سایتتان دارید.

صفحات دارای Duplicate Content
صفحاتی با محتوای مشابه

گوگل مطمئن نیست که کدام یک، صفحه اورجینال یا اصلی است. پس هر سه صفحه برای رتبه‌بندی دچار مشکل خواهند شد.

مشکل رتبه در محتواهای تکراری
مشکل محتوای تکراری در گرفتن رتبه

پنالتی شدن (خیلی به ندرت اتفاق می‌افتد)

گوگل گفته که محتوای تکراری (Duplicate Content) ممکن است منجر به یک پنالتی یا حذف شدن کامل سایت از ایندکس (Deindex) شود.

بیانیه گوگل درباره پنالتی
پیانیه گوگل درباره پنالتی شدن سایت دارای Duplicate Content

پنالتی شدن به این شکل، مساله بسیار نادری است. و فقط زمانی اتفاق می‌افتد که یک سایت از قصد و آگاهانه، محتوای سایت‌های دیگر را کپی کند.

پنالتی شدن محتوای کپی‌شده
پنالتی‌شدن محتوای کپی‌شده

پس اگر تعدادی صفحه مشابه روی سایت خود دارید، احتمالا نیازی نیست که نگران “پنالتی محتوای تکراری” یا Duplicate Content Penalty باشید.

ایندکس شدن تعداد کمتری از صفحات

این مساله بخصوص برای سایت‌هایی با تعداد صفحات خیلی زیاد مهم است. مثلا سایت‌های تجاری.

گاهی گوگل فقط به رتبه‌دهی پایین برای صفحات با محتوای تکراری اکتفا نمی‌کند. بلکه اصلا آنها را ایندکس نمی‌کند.

ایندکس نکردن صفحات با محتوای تکراری
خودداری گوگل از ایندکس صفحات دارای محتوای کپی‌شده

پس اگر صفحاتی دارید که ایندکس نمی‌شوند، ممکن است بخاطر این باشد که نرخ خزش سایت شما درحال هدررفتن بابت محتوای تکراری یا محتوای کپی‌شده است.

گام‌های مهم در جلوگیری از تولید محتوای تکراری یا محتوای کپی‌شده

تولید محتوای سئو‌شده دارای اصولی است که مدیر هر سایتی باید رعایت کند. تا رتبه بالاتری در نتایج گوگل کسب نماید. با توجه به آنچه تا اینجا یاد گرفتیم، باید به محتوایی که می‌نویسیم دقت کنیم تا حتی ناخواسته محتوای تکراری منتشر نکنیم. گاهی حتی تشخیص اینکه محتوا تکراری است یا نه ممکن است برای ما یک چالش باشد.

در ادامه نکاتی را بیان می‌کنیم که در رفع مشکلات محتوای تکراری به شما کمک خواهد کرد. پس با سئوف همراه باشید.

جستجو برای یافتن محتوای مشابه در سایر سایت‌ها

این یکی از دلایل عمده بوجود آمدن محتواهای تکراری است. برای مثال، فرض کنید یک سایت تجاری دارید. و در یک صفحه محصول، تی‌شرت می‌فروشید.

نمونه یک صفحه محصول
یک صفحه محصول

اگر همه چیز درست برنامه‌ریزی شده باشد، هر سایز و رنگی از آن تی‌شرت روی یک URL خواهد بود. (ساخت و بهینه‌سازی URLهای سایت برای سئو را از لینک مربوطه مطالعه نمایید.)

تنوع محصول روی یک URL، محتوای خوب
مثال خوب : تنوع یک محصول روی یک URL

اما گاهی متوجه می‌شوید که سایتتان یک URL جدید برای هر نسخه از محصولتان درست می‌کند. که منجر به تولید هزاران صفحه با محتوای تکراری می‌شود.

وجود URL جدا برای هر ورژن محصول
مثال بد : وجود URL جدا برای هر نسخه از یک محصول (تعداد زیادی محتوای تکراری)

نکته : در میان انواع سایت‌ها سئو سایت فروشگاهی بدلیل داشتن صفحات محصول قدری متفاوت است.

یک مثال دیگر :

اگر سایت شما دارای امکان جستجو باشد، صفحاتی که بعنوان نتایج جستجو یافت می‌شوند نیز ممکن است ایندکس شوند. و باز هم این موضوع، براحتی بیش از هزار صفحه به سایت شما می‌افزاید. که همه آنها شامل محتواهای تکراری هستند.

بررسی صفحات ایندکس‌شده

یکی از راه‌های آسان برای یافتن محتوای تکراری، بررسی تعداد صفحات ایندکس‌شده سایتتان است. می‌توانید این کار را با جستجوی عبارت Site:Example.com در گوگل انجام دهید. کلمه :Site را تایپ کنید و در ادامه آن نام دامنه خود را نوشته و جستجو کنید. مثلا برای این سایت باید عبارت Site:Seof.ir را جستجو کنیم.

جستجوی صفحات ایندکس سایت
جستجوی صفحات ایندکس‌شده سایت در گوگل

یا اینکه می‌توانید با مراجعه به کنسول جستجوی گوگل از تعداد صفحات ایندکس‌شده سایتتان مطلع شوید.

GSC و صفحات ایندکس شده
صفحات ایندکس‌شده در کنسول جستجوی گوگل

در هر دو صورت، عدد بدست‌آمده باید با تعداد صفحاتی که بصورت دستی ایجاد کرده‌اید همخوانی داشته باشد. مثلا، در تصویر بالا می‌بینید که تا کنون 152 صفحه از صفحات Seof ایندکس شده‌اند.

اگر تعداد صفحات ایندکس شده با تعداد صفحات ساخته شده همخوانی نداشت و تفاوت زیادی بین آنها بود می‌فهمیدیم که تعداد زیادی صفحه جدید در حال اضافه‌شدن هستند و به احتمال زیاد حاوی محتوای تکراری هستند.

برای مثال، یک سایت دارای 112 صفحه ایندکس‌شده است:

کل صفحات ایندکس شده یک سایت
کل صفحات ایندکس شده یک سایت در گوگل

که با تعداد صفحاتی که توسعه‌دهندگان سایت ایجاده کرده‌اند برابر است.

اگر این عدد، 16000 یا 160000 بود می‌فهمیدیم که صفحات زیادی بصورت اتوماتیک در حال اضافه شدن هستند. و آن صفحات احتمالا شامل مقادیر خاصی از محتوای تکراری می‌باشند.

اطمینان از ریدایرکت‌های صحیح سایت

گاهی مشکل فقط این نیست که چند نسخه مختلف از یک صفحه را دارید. بلکه چند نسخه مختلف از یک سایت را دارید.

با اینکه به بندرت چنین اتفاقی می‌افتد، اما چندین بار چنین چیزی مشاهده شده است.

این اتفاق زمانی می‌افتد که نسخه WWW سایت شما روی نسخه‌هایی از سایتتان که بدون WWW هستند ریدایرکت نمی‌شوند. (یا مواردی از این قبیل)

همچنین این اتفاق ممکن است زمانی رخ دهد که شما سایت خود را به HTTPS تغییر داده‌اید و سایت HTTP را ریدایرکت نکرده‌اید.

بطور خلاصه: تمام نسخه‌های مختلف سایت شما باید به یک نقطه ختم شوند.

نسخه‌های یک سایت اشاره بهصفحه اورجینال دارند
همه نسخه‌های مختلف یک سایت به یک مکان باید اشاره داشته باشند

استفاده از ریدایرکت 301

ریدایرکت‌های 301 راحت‌ترین راه برای حل مشکل محتوای تکراری در سایت هستند. پس اگر تعداد زیادی محتوای تکراری روی سایتتان پیدا کردید، آنها را به محتوای اصلی ریدایرکت کنید.

ریدایرکت 301 برای جلوگیری از محتوای تکراری
ریدایرکت 301 برای جلوگیری از محتوای تکراری

وقتی ربات گوگل به سایت شما سر بزند، ریدایرکت را پردازش خواهد کرد و فقط محتوای اورجینال (اصلی) را ایندکس خواهد کرد. که باعث می‌شود آن صفحه اورجینال شروع به رتبه گرفتن کند.

حواستان به محتوای مشابه باشد

محتوای تکراری فقط به معنی محتوایی که عینا کلمه به کلمه از جایی آورده شده نیست. در واقع گوگل محتوای تکراری را بدین شکل تعریف می‌کند:

تعریف duplicate content در گوگل
تعریف محتوای تکراری از نظر گوگل

پس حتی اگر محتوای شما از نظر فنی متفاوت از بقیه محتواهای روی وب باشد، باز هم ممکن است دچار مشکل محتوای تکراری شوید.

این مشکلی نیست که اکثریت سایت‌ها با آن مواجه باشند. اکثر سایت‌ها چند ده صفحه دارند. و روی هر صفحه محتوای یکتا و متفاوتی قرار می‌دهند.

اما حالت‌هایی وجود دارد که ممکن است باعث بوجود آمدن محتوای مشابه شوند. برای مثال، یک سایت آموزش مکالمه به زبان فرانسوی را در نظر بگیرید.

که خدمات آن در شهر بوستون و حومه آن ارائه می‌شود.

خوب، احتمالا یک صفحه خدمات دارد که برای عبارت کلیدی “Learn French Boston” بهینه‌سازی شده است.

محتوای مشابه بهینه شده برای یک عبارت
محتوایی که برای عبارت “Learn French Boston” بهینه شده است

و صفحه‌ای دیگر که تلاش می‌کند برای عبارت “Learn French Cambridge” رتبه بگیرد.

محتوای بهینه شده برای یک عبارت کلیدی
محتوایی بهینه شده برای عبارت “Learn French Cambridge”

گاهی محتوا از نظر فنی متفاوت است. برای مثال، یک صفحه دارای یک لیست از لوکیشن‌ها برای Boston است. و صفحه دیگر آدرس‌ Cambridge را دارد.

اما برای بیشتر قسمت‌ها، محتوا بسیار مشابه است.

محتوای مشابه در صفحاتی متفاوت از نظر فنی
محتوای مشابه در صفحاتی که از نظر فنی متفاوت هستند

این از نظر فنی یک محتوای تکراری است.

آیا نوشتن محتوای 100 درصد یکتا برای هرکدام از صفحات سایت بسیار دشوار است؟ بله، اما اگر برای رتبه گرفتن تک تک آن صفحات مشتاقید، حتما باید این کار را انجام دهید.

استفاده از تگ Canonical

استفاده از Canonical Tag به موتورهای جستجو می‌گوید: “ما دسته‌ای از صفحات با محتوای تکراری را داریم. اما این صفحه اورجینال است. بقیه صفحات را می‌توانید در نظر نگیرید”.

تمایز محتوای تکراری از اورجینال با Canonicaltag
تمایز بین صفحات دارای محتوای مشابه از صفحه اورجینال با استفاده از تگ کانونیکال

گوگل گفته که یک تگ کانونیکال بهتر از این است که صفحات با محتوای تکراری را بلاک کنیم.

تگ کانونیکال برای محتوای تکراری
تگ کانونیکال برای محتوای تکراری

(مثلا بلاک کردن ربات گوگل به وسیله فایل Robots.Txt یا با یک تگ نوایندکس در Html صفحه وب)

پس اگر صفحاتی با محتوای تکراری روی سایتتان پیدا کردید باید یکی از کارهای زیر را انجام دهید:

  • حذفشان کنید
  • آنها را ریدایرکت کنید
  • از تگ Canonical استفاده کنید

استفاده از یک ابزار

ابزاری برای سئو وجود دارند که با ویژگی‌تشخیص محتوای تکراری طراحی شده‌اند.

مثلا Siteliner وبسایت شما را برای یافتن صفحاتی که متحوای تکراری زیادی دارند اسکن می‌کند.

یافتن محتوای تکراری در Siteliner
پیداکردن محتوای تکراری سایت با ابزار Siteliner

تلفیق صفحات

همانطور که قبلا نیز اشاره شد، اگر تعداد زیادی صفحه با محتوای تکراری دارید، بهتر است آنها را روی یک صفحه ریدایرکت کنید. (یا از تگ Canonical استفاده کنید).

اما اگر صفحات شما محتوای مشابه داشته باشد چه؟

می‌توانید به هر صفحه یک بخش کوچک اما یکتا از محتوا را اختصاص دهید. و یا اینکه همه آنها را در یک Mega Page ادغام نمایید.

مثلا، فرض کنید سه پست بلاگی روی سایتتان دارید که از نظر فنی متفاوت هستند اما محتوایشان خیلی شبیه هم است.

محتوای مشابه اما متفاوت
3 محتوای مشابه اما متفاوت (از نظر فنی)

می‌توانید این سه پست را تبدیل به یک پست بلاگ جذاب کنید که 100 درصد یکتا است.

اغام چند محتوای مشابه در یک محتوا
ادغام چند محتوای مشابه در یک محتوا

چون محتوای تکراری را از سایتتان حذف کردید، آن صفحه باید رتبه بهتری نسبت به آن سه صفحه‌ای که ادغام شدند بگیرد.

نوایندکس کردن صفحات دسته‌بندی یا برچسب در وردپرس

اگر از وردپرس استفاده می‌کنید احتمالا متوجه شده‌اید که بصورت اتوماتیک صفحات دسته‌بندی و برچسب تولید می‌کند.

محتوای تکراری در صفحه برچسب‌ها در وردپرس
صفحه تگ‌ها در وردپرس

این صفحات منابع عظیمی از Duplicate Content هستند. برای کاربران مفیدند، پس توصیه می‌‌شود به این صفحات تگ نوایندکس اضافه کنید. بدین ترتیب، می‌توانند حضور داشته باشند بدون اینکه موتور جستجو آنها را ایندکس کند.

همچنین می‌توانید تنظیماتی در وردپرس انجام دهید که این صفحات اصلا تولید نشوند.

2 نظرات
  1. w------w می گوید

    ایا ترجمه مقالات برای گوگل، محتوای تکراری محسوب میشه؟

    1. seof می گوید

      سلام خیر

ارسال یک پاسخ

آدرس ایمیل شما منتشر نخواهد شد.