آیا تا به حال به این فکر کردهاید که چرا با وجود تولید محتوای زیاد، سایت شما در نتایج جستجو پیشرفت چندانی نمیکند؟ یکی از دلایل اصلی این مسئله میتواند وجود مشکل محتوای تکراری در سایت شما باشد. بسیاری از وبمستران و سئوکاران، به دلیل عدم آگاهی از عواقب جدی محتوای تکراری، به این مشکل بیتوجه هستند. محتوای تکراری به محتوایی گفته میشود که در چندین آدرس یا وبسایت مختلف، به صورت یکسان یا بسیار مشابه ظاهر شود. این محتوا میتواند متن، تصاویر، ویدئو یا هر نوع محتوای دیگری باشد.
گوگل بهطور مداوم در حال بهبود الگوریتمهای خود است تا بهترین و مرتبطترین نتایج را به کاربران ارائه دهد. وقتی موتورهای جستجو با محتوای تکراری مواجه میشوند، نمیدانند کدام نسخه از محتوا را بهعنوان نسخه اصلی و معتبر در نظر بگیرند. این سردرگمی منجر به کاهش رتبه سایت شما در نتایج جستجو و در نهایت کاهش ترافیک ارگانیک میشود.
فهرست موضوعات در این آموزش
رفع مشکل محتوای تکراری در سایت
محتوای تکراری به محتوایی اطلاق میشود که در چندین آدرس اینترنتی یا URL متفاوت یافت شود و از نظر موتورهای جستجو به عنوان یک نسخه کپی شده تلقی گردد. این مسئله میتواند به دلایل مختلفی از جمله کپیبرداری از محتوا، ایجاد صفحات آرشیو، پارامترهای URL و … رخ دهد.
موتورهای جستجو مانند گوگل به دنبال ارائه بهترین و مرتبطترین نتایج برای کاربران هستند. وقتی محتوای تکراری وجود دارد، الگوریتم های گوگل متوجه می شوند و با چالش های زیر مواجه می شوند :
- کدام نسخه را نمایش دهند؟ موتور جستجو نمیداند کدام نسخه از محتوا را بهعنوان نسخه اصلی و معتبر در نظر بگیرد.
- چگونه اعتبار محتوا را توزیع کنند؟ اگر محتوای شما در چندین آدرس وجود داشته باشد، موتور جستجو نمیداند چگونه اعتبار و رتبه را بین این آدرسها تقسیم کند.
- تجربه کاربری ضعیف: محتوای تکراری میتواند تجربه کاربری ضعیفی ایجاد کند، زیرا کاربران ممکن است مجبور شوند صفحات مشابهی را چندین بار ببینند.
دلایل ایجاد مشکل محتوای تکراری در سایت
توجه داشته باشید که الگوریتم پنگوئن گوگل به راحتی محتوای تکراری سایت را تشخیص می دهد حالا که میدونیم که محتوای تکراری برای سایت ما خیلی ضرر داره و بهتره داخل سایت چنین محتواهایی نباشه. اما الان وقتش رسیده که بدونیم این دلیل بوجود آمدن این مشکل چیست؟
- محتوای تکراری داخلی
- محتوای تکراری داخلی، زمانی رخ میدهد که محتوای مشابه یا یکسانی در صفحات مختلف یک وبسایت وجود داشته باشد. این نوع محتوا، رایجترین نوع محتوای تکراری است و میتواند به دلایل مختلفی ایجاد شود.
صفحات با پارامترهای URL متفاوت:
- مثالی از یک فروشگاه اینترنتی: محصولی با رنگهای مختلف ممکن است آدرسهای URL متفاوتی داشته باشد (مثلاً html?color=red و product.html?color=blue)، اما محتوای اصلی محصول در هر دو صفحه یکسان است.
نسخههای موبایل و دسکتاپ یک صفحه:
- طراحیهای متفاوت برای نسخههای موبایل و دسکتاپ یک صفحه میتواند منجر به ایجاد محتوای تکراری جزئی شود.
صفحات آرشیو و دسته بندی:
- اگر محتوای صفحات آرشیو و دسته بندیها به طور کامل از محتوای صفحات اصلی کپی شده باشد، محتوای تکراری ایجاد میشود.
تگهای عنوان و توضیحات متا تکراری:
- استفاده از تگهای عنوان و توضیحات متا یکسان برای صفحات مختلف، حتی اگر محتوای اصلی صفحات متفاوت باشد، میتواند به عنوان محتوای تکراری در نظر گرفته شود.
- محتوای تکراری بین سایت ها
محتوای تکراری بین سایتها، زمانی رخ میدهد که محتوای یکسانی در دو یا چند وبسایت مختلف منتشر شود. این نوع محتوا میتواند به دلایل مختلفی ایجاد شود، از جمله:
- کپی کردن محتوا: کپی کردن مستقیم محتوا از یک وبسایت دیگر بدون ذکر منبع، یک تخلف آشکار است و میتواند عواقب جدی برای سایت شما داشته باشد.
- محتوای تولید شده توسط کاربر: اگر کاربران بتوانند محتوای شما را در سایتهای دیگر منتشر کنند، این محتوا ممکن است به عنوان محتوای تکراری شناسایی شود.
- محتوای تکراری ناشی از پویایی سایت
محتوای تکراری ناشی از پویایی سایت زمانی رخ میدهد که به دلیل ویژگیهای پویا و تعاملی یک وبسایت، صفحات مختلفی با محتوای تقریباً یکسان یا مشابه ایجاد شوند. این پدیده به خصوص در وبسایتهایی که امکان جستجوی پیشرفته، فیلتر کردن نتایج، شخصیسازی محتوا و یا ایجاد پروفایل کاربری را فراهم میکنند، رایج است.
- پارامترهای جستجو: نتایج جستجوی داخلی در یک سایت، ممکن است محتوای تکراری ایجاد کند، به خصوص اگر فیلترهای جستجو نتایج یکسانی را تولید کنند.
- پروفایل کاربری: برخی از سیستمهای مدیریت محتوا، برای هر پروفایل کاربری یک URL منحصر به فرد ایجاد میکنند که ممکن است منجر به ایجاد صفحات تکراری شود.
- محتوای تکراری ناشی از خطاهای فنی
این خطاها اغلب به دلیل پیکربندی نادرست سیستم یا تغییرات اعمال شده در ساختار سایت رخ میدهند. در ادامه، دو مورد از رایجترین خطاهای فنی که منجر به ایجاد محتوای تکراری میشوند را به طور مفصل بررسی میکنیم.
خطاهای ریدایرکت
- ریدایرکتها (Redirects) ابزاری قدرتمند برای هدایت کاربران از یک آدرس URL به آدرس دیگری هستند. اما اگر ریدایرکتها به درستی پیکربندی نشوند، میتوانند به جای حل مشکل، آن را پیچیدهتر کنند.
- ریدایرکتهای زنجیرهای: زمانی که چندین ریدایرکت به صورت متوالی روی هم قرار بگیرند، ریدایرکت زنجیرهای ایجاد میشود. این نوع ریدایرکتها علاوه بر افزایش زمان بارگذاری صفحات، میتوانند باعث ایجاد حلقههای بینهایت و در نهایت، خطاهای 500 شوند.
- ریدایرکتهای نامناسب به صفحات تکراری: اگر صفحهای به صفحهای دیگر با محتوای مشابه ریدایرکت شود، موتورهای جستجو ممکن است هر دو صفحه را به عنوان محتوای تکراری در نظر بگیرند.
- ریدایرکتهای موقت به جای دائمی: ریدایرکتهای موقت (302) به موتورهای جستجو سیگنال میدهند که تغییر آدرس موقتی است. در حالی که برای تغییرات موقت مناسب هستند، اما برای تغییر دائمی آدرسها، باید از ریدایرکتهای دائمی (301) استفاده شود.
- مشکلات در فایل robots.txt
فایل robots.txt یک فایل متنی است که در ریشه سایت قرار دارد و به موتورهای جستجو میگوید کدام صفحات را ایندکس کنند و کدام صفحات را ایندکس نکنند. اگر این فایل به درستی تنظیم نشده باشد، میتواند باعث ایجاد مشکلات مختلفی از جمله محتوای تکراری شود.
- مسدود کردن صفحات مهم: اگر به اشتباه صفحاتی را که میخواهید ایندکس شوند، در فایل txt مسدود کنید، این صفحات از نتایج جستجو حذف خواهند شد.
- مسدود کردن بخشهایی از سایت: اگر بخشهایی از سایت را که حاوی محتوای تکراری هستند، در فایل txt مسدود کنید، این مشکل به طور موقت حل میشود، اما مشکل اصلی برطرف نمیشود.
- استفاده نادرست از پارامترهای txt: استفاده نادرست از پارامترهای مختلف فایل robots.txt میتواند باعث ایجاد مشکلات پیشبینیناپذیری شود.
تأثیرات منفی محتوای تکراری بر سئو
محتوای تکراری، همانند یک مانع بزرگ بر سر راه پیشرفت سایت در نتایج جستجو عمل میکند. موتورهای جستجوبه خصوص گوگل به دنبال ارائه بهترین و مرتبطترین نتایج به کاربران هستند و وجود محتوای تکراری، این کار را برای آنها دشوار میسازد.
- کاهش رتبهبندی سایت: موتورهای جستجو به سایتهایی که محتوای یونیک و باکیفیت ارائه میدهند، امتیاز بالاتری میدهند. زمانی که محتوای یک سایت در چندین آدرس یا URL تکرار میشود، موتورهای جستجو نمیتوانند به درستی تشخیص دهند که کدام نسخه از محتوا معتبرتر است و در نتیجه، رتبه سایت کاهش مییابد.
- افزایش نرخ پرش: کاربران به سرعت صفحات تکراری را ترک میکنند. زمانی که یک کاربر با جستجوی یک عبارت خاص وارد سایت میشود و با محتوایی روبرو میشود که قبلاً آن را دیده است، احساس ناامیدی میکند و سریعاً سایت را ترک میکند. افزایش نرخ پرش، سیگنال منفی دیگری برای موتورهای جستجو است و نشان میدهد که محتوای سایت برای کاربران جذاب نیست.
- کاهش اعتبار سایت: وجود محتوای تکراری میتواند به عنوان یک رفتار غیر حرفهای و کپیبرداری تلقی شود و اعتبار سایت را در نظر موتورهای جستجو کاهش دهد. این موضوع به ویژه زمانی اهمیت پیدا میکند که رقبای شما محتوای باکیفیت و یونیک تولید کنند.
روشهای رفع محتوای تکراری
روش های متعددی برای رفع محتوای تکراری در سایت . بهترین و سریع ترین روش ها برای رفع این مشکل به شرح زیر هستند:
- تگ کنونیکال (Canonical)
تگ کنونیکال یک عنصر HTML است که به موتورهای جستجو اعلام میکند کدام نسخه از یک صفحه، نسخه اصلی و ترجیحی محسوب میشود. به عبارت دیگر، با استفاده از این تگ، به موتورهای جستجو میگوییم که کدام صفحه را برای ایندکس کردن و رتبهبندی انتخاب کنند. این کار به ویژه زمانی مفید است که چندین URL به یک محتوای مشابه اشاره کنند.
فرض کنید یک محصول در فروشگاه اینترنتی شما در رنگهای مختلف موجود است و هر رنگ یک URL جداگانه دارد. با استفاده از تگ Canonical، میتوانید به موتورهای جستجو بگویید که تمام صفحات محصول با رنگهای مختلف به صفحه اصلی محصول ارجاع داده شوند.
نحوه استفاده:
HTML
<link rel=”canonical” href=”https://example.com/original-page” />
در این مثال، تگ کنونیکال به موتورهای جستجو میگوید که صفحه فعلی یک نسخه تکراری است و نسخه اصلی آن در آدرس https://example.com/original-page قرار دارد.
- ریدایرکت 301
ریدایرکت 301 یک روش دائمی برای هدایت کاربران و موتورهای جستجو از یک آدرس اینترنتی (URL) به آدرس دیگری است. این روش معمولاً برای ادغام صفحات مشابه، تغییر ساختار سایت یا تغییر آدرس دامنه استفاده میشود.
نحوه استفاده: ریدایرکت 301 معمولاً در فایل .htaccess یا از طریق تنظیمات سرور انجام میشود. برای مثال، در فایل .htaccess میتوانید از کد زیر استفاده کنید:
Redirect 301 /old-page.html https://example.com/new-page.html
این کد به موتورهای جستجو میگوید که صفحه old-page.html به طور دائمی به صفحه https://example.com/new-page.html منتقل شده است.
- متا تگ noindex
متا تگ noindex به موتورهای جستجو میگوید که صفحهای را ایندکس نکنند. این تگ زمانی مفید است که صفحهای حاوی اطلاعات تکراری یا کم اهمیت باشد و بخواهیم از نمایش آن در نتایج جستجو جلوگیری کنیم.
صفحاتی مانند صفحات تشکر پس از خرید، صفحات جستجوی داخلی با نتایج بسیار محدود و صفحات حاوی اطلاعات تکراری را میتوان با استفاده از متا تگ noindex از ایندکس خارج کرد.
نحوه استفاده:
HTML
<meta name=”robots” content=”noindex”>
- فایل robots.txt
فایل robots.txt یک فایل متنی است که در ریشه دایرکتوری وبسایت قرار میگیرد و به موتورهای جستجو میگوید کدام بخشهای سایت را بخزند و کدام بخشها را نادیده بگیرند. با استفاده از این فایل، میتوانیم به موتورهای جستجو بگوییم که صفحات حاوی محتوای تکراری را ایندکس نکنند.
نحوه استفاده:
User-agent: *
Disallow: /duplicate-content/
در این مثال، موتورهای جستجو از خزش دایرکتوری duplicate-content منع شدهاند.
- Google Search Console
Google Search Console ابزاری قدرتمند برای مدیریت صفحات با پارامترهای مختلف است. این ابزار به شما امکان میدهد تا مشخص کنید که کدام صفحات با پارامترهای مشابه باید ایندکس شوند و کدام صفحات باید حذف شوند.
با مراجعه به سرچ کنسول و بخش ایندکسینگ میتوانید خطاهای موجود در سایت را مشاهده کنید. اگر سایت مشکل محتوای تکراری داشته باشد در این بخش نمایش داده میشود شما میتوانید فورا برای رفع آن اقدام کنید.
- استفاده از schema
داده های ساختار یافته (Schema Markup) به موتورهای جستجو کمک میکند تا محتوای شما را بهتر درک کنند و صفحات شما را در نتایج جستجو برجستهتر نمایش دهند. با استفاده از ساختار داده، میتوانید به موتورهای جستجو اطلاعات بیشتری درباره محتوای صفحات خود ارائه دهید و از این طریق، مشکل محتوای تکراری را کاهش دهید.
چگونه از اسکیما استفاده کنیم؟
- شناسایی نوع محتوا: ابتدا باید مشخص کنید که چه نوع محتوایی دارید. مثلاً یک محصول، یک مقاله، یک رویداد و … .
- انتخاب نوع اسکیما: برای هر نوع محتوا، اسکیماهای مختلفی وجود دارد. مثلاً برای محصولات از اسکیما محصول، برای مقالات از اسکیما مقاله و … استفاده میشود.
- اضافه کردن کد اسکیما به صفحه: کد اسکیما را در بخش <head> صفحه خود قرار دهید. این کد معمولاً به صورت JSON-LD نوشته میشود.
<script type=”application/ld+json”>
{
“@context”: “https://schema.org”,
“@type”: “Product”,
“name”: “گوشی موبایل سامسونگ گلکسی S23”,
“image”: “https://example.com/image.jpg”,
“description”: “بهترین گوشی هوشمند سامسونگ در سال 2023”,
“brand”: {
“@type”: “Brand”,
“name”: “سامسونگ”
}
}
</script>
- استفاده از پارامترهای URL دینامیک
پارامترهای URL دینامیک میتوانند باعث ایجاد صفحات تکراری شوند. برای مثال، یک فروشگاه اینترنتی ممکن است برای هر محصول با رنگ، اندازه و یا ویژگیهای مختلف یک URL جداگانه ایجاد کند. این امر منجر به تولید تعداد زیادی صفحه مشابه میشود.
- راه حل:
- استفاده از JavaScript: با استفاده از جاوا اسکریپت میتوانید پارامترهای URL را پنهان کرده و از ایجاد صفحات تکراری جلوگیری کنید.
- Canonicalization: برای صفحات مشابه با پارامترهای مختلف، از تگ canonical استفاده کنید تا به موتورهای جستجو بگویید که کدام صفحه نسخه اصلی است.
- ساختار URL تمیز: سعی کنید ساختار URL خود را ساده و قابل فهم نگه دارید و از پارامترهای غیرضروری خودداری کنید.
چرا محتوای تکراری برای سئو مضر است؟
گوگل می گوید چیزی به عنوان جریمه محتوای تکراری وجود ندارد. اما محتوای تکراری به چند دلیل می تواند به عملکرد سئوی شما آسیب برساند. از آنجایی که بیش از یک URL محتوای یکسانی را نشان میدهد، موتورهای جستجو نمیدانند کدام URL را بالاتر در نتایج جستجو فهرست کنند. بنابراین ممکن است هر دو URL را پایینتر قرار دهند و به سایر صفحات وب ترجیح دهند. با یک مثال قضیه را روشن میکنم؛
محتوای تکراری را میتوان به قرار گرفتن در یک چهارراه تشبیه کرد که علائم جادهای در دو جهت مختلف برای یک مقصد مشخص میشوند: کدام جاده را باید طی کنید؟ بدتر از آن، مقصد نهایی نیز متفاوت است. به عنوان یک خواننده، ممکن است برایتان مهم نباشد که همچنان پاسخی را که برای آن آمدهاید دریافت کنید، اما یک موتور جستجو باید انتخاب کند که کدام صفحه را در نتایج جستجو نشان دهد، البته که نمیخواهد همان محتوا را دو بار نشان دهد.
چرا باید از محتوای تکراری در سایت خود جلوگیری کنید؟
محتوای تکراری به رتبه شما آسیب می زند. زیرا موتورهای جستجو نمی دانند که کدام صفحه را به کاربران پیشنهاد دهند. و در نتیجه، تمام صفحاتی که موتورهای جستجو تکراری می بینند، در معرض خطر قرار گرفتن در رتبه پایین تر هستند. اگر مشکلات محتوای تکراری شما واقعاً بد است، به عنوان مثال اگر محتوای بسیار ضعیفی همراه با محتوای کپی شده دارید، حتی ممکن است با اقدام دستی گوگل به دلیل تلاش برای فریب دادن کاربران روبرو شوید. بنابراین اگر میخواهید محتوای شما رتبهبندی شود، بسیار مهم است که اطمینان حاصل کنید که هر صفحه مقدار مناسبی از محتوای منحصر به فرد را ارائه میکند.
اگرچه این فقط یک مشکل برای موتورهای جستجو نیست. اگر کاربران شما در حال جستجوی صفحه خاصی هستند، اگر نتوانند صفحه مورد نظر خود را پیدا کنند، می تواند برای آنها خسته کننده باشد. بنابراین، مانند بسیاری از جنبههای سئو، مهم است که به مشکلات محتوای تکراری خود برای تجربه کاربر و همچنین بحث جستجو رسیدگی کنید.
روش های شناسایی مشکل محتوای تکراری
حال که علت و روشهای رفع این مشکل را پیدا کردیم بیایید این محتواها را در سایت شناسایی کنیم، اما چگونه؟ ابزارهایی وجود دارند که در این زمینه میتوانند به شما کمک کنند مانند siteliner.com که اگر محتوای تکراری در سایت داشته باشید به خوبی میتواند آن را شناسایی کند. بعد از ورود به این سایت و وارد کردن آدرس سایت خود میتوانید شاهد محتواهای تکراری موجود در سایت خود باشید.
پیدا کردن محتواهای کپی و مشابه سایت ما در گوگل : برای اینکه بفهمیم برای صفحات ما محتوای تکراری یا مشابه در سطح گوگل وجود دارد میتوانیم به وبسایت Copyscape مراجعه کنیم و در این وبسایت به ما نشان میدهد چه صفحاتی مشابه ما در سطح وب وجود دارند.
راه دومی که میتوانید متوجه تکراری بودن محتوا شوید سرچ آن عبارت در گوگل است . پیشتر هنگامی که مطلبی تکراری را در گوگل سرچ میکردیم آن را به صورت متن هایلایت شده نمایش میداد حالا آن را به صورت متن بولد شده نشان میدهد و از این طریق شما میتوانید متوجه شوید این مطلب در سایتهای دیگر موجود است
محتوای تکراری را شناختیم و فهمیدیم در صورت وجود چند محتوا شبیه هم، موتورهای جستجو مانند گوگل نمی دانند کدام URL را ابتدا در نتایج جستجو نشان دهند. آنها سعی میکنند تعیین کنند که کدام نتیجه برای جستجوی خاص مرتبطتر است، اما این احتمال وجود دارد که آن را اشتباه بگیرند اگر گوگل آن را “اشتباه” بگیرد ممکن است مخاطب هدف شما محتوای شما را نبیند یا، آنها با محتوای شما درگیر نمی شوند، زیرا صفحه ای که گوگل به آنها نشان می دهد به هدف جستجوی آنها پاسخ نمی دهد.
سخن پایانی
رفع محتوای تکراری، به سادگی به معنای ارائه محتوای یونیک است اما فراموش نکنید این به معنی با کیفیت بودن آن نیست. با صرف کمی زمان و توجه به نکات گفته شده در این مقاله، میتوانید به راحتی از شر محتوای تکراری خلاص شوید و به نتایج بهتری در سئو دست پیدا کنید. به یاد داشته باشید، سئو یک بازی طولانی است و تولید محتوای باکیفیت، کلید موفقیت در این بازی است.
سوالات متداول رفع محتوای تکراری در سایت
- چرا محتوای تکراری برای سئو مضر است؟
محتوای تکراری باعث سردرگمی موتورهای جستجو میشود و منجر به کاهش رتبه سایت، افزایش نرخ پرش و کاهش اعتبار سایت میشود.
- چگونه میتوانیم محتوای تکراری را شناسایی کنیم؟
برای شناسایی محتوای تکراری میتوان از ابزارهای سئو مانند Google Search Console، SEMrush و Ahrefs استفاده کرد. همچنین، بررسی دستی سایت نیز میتواند به شناسایی صفحات تکراری کمک کند.
- بهترین روش برای رفع محتوای تکراری چیست؟
انتخاب بهترین روش برای رفع محتوای تکراری به نوع و میزان تکراری بستگی دارد. از جمله روشهای رایج میتوان به استفاده از تگ کنونیکال، ریدایرکت 301، متا تگ noindex و فایل robots.txt اشاره کرد.
- آیا میتوان از ایجاد محتوای تکراری جلوگیری کرد؟
بله، با برنامهریزی دقیق، استفاده از ساختار URL مناسب، ایجاد محتوای یونیک و باکیفیت و به روز رسانی منظم محتوا میتوان از ایجاد محتوای تکراری جلوگیری کرد.
1 Comment
ب جز الگوریتم پنگوئن چ الگوریتمی محتوا سایت و بررسی میکنه