محتوای تکراری چیست؟ – تاثیر محتوای تکراری بر سئو
در بخشهای قبلی دوره آموزش سئو درباره بهینهسازی محتوا صحبت کردیم. یکی از نکات مهم در بهینهسازی محتوا، جلوگیری از تولید محتوای تکراری یا محتوای کپی شده است. بخاطر تاثیر محتوای تکراری بر سئو سایت، باید در تولید محتوا دقت کنید و از ایجاد محتوای تکراری جلوگیری نمایید.
Duplicate Content یا محتوای تکراری چیست؟
محتوای تکراری (Duplicate Content) یا محتوای کپیشده محتوایی است که مشابه یا کپی دقیق محتواهایی در سایر وبسایتها یا صفحات دیگر همان سایت باشد.
وجود محتوای تکراری زیاد در یک وبسایت، میتواند تاثیر منفی در رتبهبندی آن سایت در گوگل داشته باشد.
بعبارتی دیگر محتوای تکراری محتوایی است که کلمه به کلمه آن عینا در یک صفحه دیگر تکرار شده باشد.
به محتوایی که مشابه یک محتوای دیگر باشد (حتی اگر بازنویسی شده باشد) نیز محتوای تکراری میگویند.
تاثیر محتوای تکراری بر سئو سایت چیست؟
بطور کلی، گوگل تمایل ندارد که صفحات دارای محتوای تکراری را رتبهبندی کند. در واقع، گوگل میگوید:
“گوگل شدیدا سعی دارد تا صفحاتی را ایندکس کند و به کاربر نمایش دهد که اطلاعات متمایزی داشته باشند.”
پس اگر صفحاتی روی سایتتان داشته باشید که اطلاعات متمایزی نداشته باشند (یعنی محتوای متمایزی نداشته باشند)، این مساله تاثیر منفی روی رتبه شما در صفحات نتایج جستجو SERPs که توسط موتور جستجو نمایش داده میشود خواهد داشت.
مشکلاتی که از داشتن محتوای تکراری زیاد ناشی میشود
در اینجا سه مساله اصلی را برای شما تشریح میکنیم که سایتهای دارای محتوای تکراری زیاد با آنها مواجه هستند.
ترافیک طبیعی کمتر
این یک مساله کاملا بدیهی است. گفتیم که گوگل نمیخواهد صفحاتی را که محتوای صفحات ایندکسشده گوگل (شامل صفحات سایت شما هم میشود) را کپی میکنند رتبهبندی کند. برای مثال فرض کنید سه صفحه با محتوای مشابه روی سایتتان دارید.
گوگل مطمئن نیست که کدام یک، صفحه اورجینال یا اصلی است. پس هر سه صفحه برای رتبهبندی دچار مشکل خواهند شد.
پنالتی شدن (خیلی به ندرت اتفاق میافتد)
گوگل گفته که محتوای تکراری (Duplicate Content) ممکن است منجر به یک پنالتی یا حذف شدن کامل سایت از ایندکس (Deindex) شود.
پنالتی شدن به این شکل، مساله بسیار نادری است. و فقط زمانی اتفاق میافتد که یک سایت از قصد و آگاهانه، محتوای سایتهای دیگر را کپی کند.
پس اگر تعدادی صفحه مشابه روی سایت خود دارید، احتمالا نیازی نیست که نگران “پنالتی محتوای تکراری” یا Duplicate Content Penalty باشید.
ایندکس شدن تعداد کمتری از صفحات
این مساله بخصوص برای سایتهایی با تعداد صفحات خیلی زیاد مهم است. مثلا سایتهای تجاری.
گاهی گوگل فقط به رتبهدهی پایین برای صفحات با محتوای تکراری اکتفا نمیکند. بلکه اصلا آنها را ایندکس نمیکند.
پس اگر صفحاتی دارید که ایندکس نمیشوند، ممکن است بخاطر این باشد که نرخ خزش سایت شما درحال هدررفتن بابت محتوای تکراری یا محتوای کپیشده است.
گامهای مهم در جلوگیری از تولید محتوای تکراری یا محتوای کپیشده
تولید محتوای سئوشده دارای اصولی است که مدیر هر سایتی باید رعایت کند. تا رتبه بالاتری در نتایج گوگل کسب نماید. با توجه به آنچه تا اینجا یاد گرفتیم، باید به محتوایی که مینویسیم دقت کنیم تا حتی ناخواسته محتوای تکراری منتشر نکنیم. گاهی حتی تشخیص اینکه محتوا تکراری است یا نه ممکن است برای ما یک چالش باشد.
در ادامه نکاتی را بیان میکنیم که در رفع مشکلات محتوای تکراری به شما کمک خواهد کرد. پس با سئوف همراه باشید.
جستجو برای یافتن محتوای مشابه در سایر سایتها
این یکی از دلایل عمده بوجود آمدن محتواهای تکراری است. برای مثال، فرض کنید یک سایت تجاری دارید. و در یک صفحه محصول، تیشرت میفروشید.
اگر همه چیز درست برنامهریزی شده باشد، هر سایز و رنگی از آن تیشرت روی یک URL خواهد بود. (ساخت و بهینهسازی URLهای سایت برای سئو را از لینک مربوطه مطالعه نمایید.)
اما گاهی متوجه میشوید که سایتتان یک URL جدید برای هر نسخه از محصولتان درست میکند. که منجر به تولید هزاران صفحه با محتوای تکراری میشود.
نکته : در میان انواع سایتها سئو سایت فروشگاهی بدلیل داشتن صفحات محصول قدری متفاوت است.
یک مثال دیگر :
اگر سایت شما دارای امکان جستجو باشد، صفحاتی که بعنوان نتایج جستجو یافت میشوند نیز ممکن است ایندکس شوند. و باز هم این موضوع، براحتی بیش از هزار صفحه به سایت شما میافزاید. که همه آنها شامل محتواهای تکراری هستند.
بررسی صفحات ایندکسشده
یکی از راههای آسان برای یافتن محتوای تکراری، بررسی تعداد صفحات ایندکسشده سایتتان است. میتوانید این کار را با جستجوی عبارت Site:Example.com در گوگل انجام دهید. کلمه :Site را تایپ کنید و در ادامه آن نام دامنه خود را نوشته و جستجو کنید. مثلا برای این سایت باید عبارت Site:Seof.ir را جستجو کنیم.
یا اینکه میتوانید با مراجعه به کنسول جستجوی گوگل از تعداد صفحات ایندکسشده سایتتان مطلع شوید.
در هر دو صورت، عدد بدستآمده باید با تعداد صفحاتی که بصورت دستی ایجاد کردهاید همخوانی داشته باشد. مثلا، در تصویر بالا میبینید که تا کنون 152 صفحه از صفحات Seof ایندکس شدهاند.
اگر تعداد صفحات ایندکس شده با تعداد صفحات ساخته شده همخوانی نداشت و تفاوت زیادی بین آنها بود میفهمیدیم که تعداد زیادی صفحه جدید در حال اضافهشدن هستند و به احتمال زیاد حاوی محتوای تکراری هستند.
برای مثال، یک سایت دارای 112 صفحه ایندکسشده است:
که با تعداد صفحاتی که توسعهدهندگان سایت ایجاده کردهاند برابر است.
اگر این عدد، 16000 یا 160000 بود میفهمیدیم که صفحات زیادی بصورت اتوماتیک در حال اضافه شدن هستند. و آن صفحات احتمالا شامل مقادیر خاصی از محتوای تکراری میباشند.
اطمینان از ریدایرکتهای صحیح سایت
گاهی مشکل فقط این نیست که چند نسخه مختلف از یک صفحه را دارید. بلکه چند نسخه مختلف از یک سایت را دارید.
با اینکه به بندرت چنین اتفاقی میافتد، اما چندین بار چنین چیزی مشاهده شده است.
این اتفاق زمانی میافتد که نسخه WWW سایت شما روی نسخههایی از سایتتان که بدون WWW هستند ریدایرکت نمیشوند. (یا مواردی از این قبیل)
همچنین این اتفاق ممکن است زمانی رخ دهد که شما سایت خود را به HTTPS تغییر دادهاید و سایت HTTP را ریدایرکت نکردهاید.
بطور خلاصه: تمام نسخههای مختلف سایت شما باید به یک نقطه ختم شوند.
استفاده از ریدایرکت 301
ریدایرکتهای 301 راحتترین راه برای حل مشکل محتوای تکراری در سایت هستند. پس اگر تعداد زیادی محتوای تکراری روی سایتتان پیدا کردید، آنها را به محتوای اصلی ریدایرکت کنید.
وقتی ربات گوگل به سایت شما سر بزند، ریدایرکت را پردازش خواهد کرد و فقط محتوای اورجینال (اصلی) را ایندکس خواهد کرد. که باعث میشود آن صفحه اورجینال شروع به رتبه گرفتن کند.
حواستان به محتوای مشابه باشد
محتوای تکراری فقط به معنی محتوایی که عینا کلمه به کلمه از جایی آورده شده نیست. در واقع گوگل محتوای تکراری را بدین شکل تعریف میکند:
پس حتی اگر محتوای شما از نظر فنی متفاوت از بقیه محتواهای روی وب باشد، باز هم ممکن است دچار مشکل محتوای تکراری شوید.
این مشکلی نیست که اکثریت سایتها با آن مواجه باشند. اکثر سایتها چند ده صفحه دارند. و روی هر صفحه محتوای یکتا و متفاوتی قرار میدهند.
اما حالتهایی وجود دارد که ممکن است باعث بوجود آمدن محتوای مشابه شوند. برای مثال، یک سایت آموزش مکالمه به زبان فرانسوی را در نظر بگیرید.
که خدمات آن در شهر بوستون و حومه آن ارائه میشود.
خوب، احتمالا یک صفحه خدمات دارد که برای عبارت کلیدی “Learn French Boston” بهینهسازی شده است.
و صفحهای دیگر که تلاش میکند برای عبارت “Learn French Cambridge” رتبه بگیرد.
گاهی محتوا از نظر فنی متفاوت است. برای مثال، یک صفحه دارای یک لیست از لوکیشنها برای Boston است. و صفحه دیگر آدرس Cambridge را دارد.
اما برای بیشتر قسمتها، محتوا بسیار مشابه است.
این از نظر فنی یک محتوای تکراری است.
آیا نوشتن محتوای 100 درصد یکتا برای هرکدام از صفحات سایت بسیار دشوار است؟ بله، اما اگر برای رتبه گرفتن تک تک آن صفحات مشتاقید، حتما باید این کار را انجام دهید.
استفاده از تگ Canonical
استفاده از Canonical Tag به موتورهای جستجو میگوید: “ما دستهای از صفحات با محتوای تکراری را داریم. اما این صفحه اورجینال است. بقیه صفحات را میتوانید در نظر نگیرید”.
گوگل گفته که یک تگ کانونیکال بهتر از این است که صفحات با محتوای تکراری را بلاک کنیم.
(مثلا بلاک کردن ربات گوگل به وسیله فایل Robots.Txt یا با یک تگ نوایندکس در Html صفحه وب)
پس اگر صفحاتی با محتوای تکراری روی سایتتان پیدا کردید باید یکی از کارهای زیر را انجام دهید:
- حذفشان کنید
- آنها را ریدایرکت کنید
- از تگ Canonical استفاده کنید
استفاده از یک ابزار
ابزاری برای سئو سایت وجود دارند که با ویژگیتشخیص محتوای تکراری طراحی شدهاند.
مثلا Siteliner وبسایت شما را برای یافتن صفحاتی که متحوای تکراری زیادی دارند اسکن میکند.
تلفیق صفحات
همانطور که قبلا نیز اشاره شد، اگر تعداد زیادی صفحه با محتوای تکراری دارید، بهتر است آنها را روی یک صفحه ریدایرکت کنید. (یا از تگ Canonical استفاده کنید).
اما اگر صفحات شما محتوای مشابه داشته باشد چه؟
میتوانید به هر صفحه یک بخش کوچک اما یکتا از محتوا را اختصاص دهید. و یا اینکه همه آنها را در یک Mega Page ادغام نمایید.
مثلا، فرض کنید سه پست بلاگی روی سایتتان دارید که از نظر فنی متفاوت هستند اما محتوایشان خیلی شبیه هم است.
میتوانید این سه پست را تبدیل به یک پست بلاگ جذاب کنید که 100 درصد یکتا است.
چون محتوای تکراری را از سایتتان حذف کردید، آن صفحه باید رتبه بهتری نسبت به آن سه صفحهای که ادغام شدند بگیرد.
نوایندکس کردن صفحات دستهبندی یا برچسب در وردپرس
اگر از وردپرس استفاده میکنید احتمالا متوجه شدهاید که بصورت اتوماتیک صفحات دستهبندی و برچسب تولید میکند.
این صفحات منابع عظیمی از Duplicate Content هستند. برای کاربران مفیدند، پس توصیه میشود به این صفحات تگ نوایندکس اضافه کنید. بدین ترتیب، میتوانند حضور داشته باشند بدون اینکه موتور جستجو آنها را ایندکس کند.
همچنین میتوانید تنظیماتی در وردپرس انجام دهید که این صفحات اصلا تولید نشوند.
ایا ترجمه مقالات برای گوگل، محتوای تکراری محسوب میشه؟
سلام خیر
وقتتون بخیر
آیا نقل قول از سایت های مختلف در یک صفحه در صورتی که لینک شوند هم محتوای تکراری قلمداد می شود؟
سلام بهتره لابلای نقل قول ها متن و هدینگ های خودتون رو هم بزارید