קבל דוח בחינם
כניסת לקוחות
Phone Link Icon 050-8127373
Lang Icon EN
מדריך תוכן משוכפל: איך למצוא ולתקן תכנים משוכפלים
תוכן משוכפל וSEO

מדריך תוכן משוכפל: איך למצוא ולתקן תכנים משוכפלים

לאחרונה במסגרת אחד הפרוייקטים המאתגרים שיצא לי לעבוד עליהם כחלק מפעילות קידום האתרים שלנו בחו"ל נתקלתי בסוגייה של תוכן משוכפל ולכן חשבתי שמאמר בנושא יכול לעשות הרבה סדר ובעיקר לחסוך עבודה וזמן יקר למקדמים אחרים.

תוכן משוכפל / מועתק עלול לפגוע במאמצי הקידום האורגני באתר, בין אם באתר עצמו ובין אם מחוצה לו. אומנם גוגל לא מעניש על תוכן משוכפל, אבל הוא בהחלט יכול לסנן אותנו מהתוצאות – מה שיוביל לירידה בנראות האורגנית ובביצועים בהמשך.

סוגים של תוכן משוכפל

שכפול של תוכן מגיע בדרך כלל בשתי צורות עיקריות:

  • בתוך האתר (On-site) – כאשר אותו תוכן נמצא בשתי כתובות URL זהות או יותר מכך. אומנם זה ניתן לשליטה יותר בקלות מאשר במצבים חיצוניים, אבל לא תמיד אנו מודעים לכך (בעיקר באתרי איקומרס, בחלק של המוצרים ולפעמים גם בחלקים אחרים).
  • מחוץ לאתר (Off-site) – כאשר שני אתרים או יותר כוללים את אותה פיסת תוכן. כאן קצת יותר קשה לשלוט על המתרחש, ובייחוד למנוע מאחרים להעתיק מאיתנו תוכן; אבל עדיין יש לא מעט דברים שניתן לעשות כדי לטפל בבעיה ברגע שגילינו אותה.

תוכן משוכפל מתחרה בעצמו. זה ההסבר הפשוט ביותר שניתן לתת במשפט קצר אחד. כל עמוד משוכפל עשוי לקבל חשיפות וכניסות, אבל אבל בסיכומו של דבר אף אחד מהעמודים המשוכפלים לא יקבל את מלוא הערך החיובי שהיה יכול לקבל, אם היה מדובר בתוכן ייחודי.

כדי לענות על השאלה "למה תוכן משוכפל זה בעיה", נדבר קודם כל על למה תוכן ייחודי זה מצוין. ראשית כל, זו דרך מעולה לבדל את עצמנו מאחרים. ככל שהתוכן שלכם מקורי ורלוונטי יותר, כך גדלים הסיכויים שתיחרטו בראשם של המשתמשים (ואפילו עוד יותר, אם התוכן שלכם פתר להם בעיה או גרם להם לפנות אליכם). נקודה נוספת קשורה כמובן לזכויות יוצרים וכן לתדמית ולכיס שלכם – אם אתם מעתיקים מאחרים, זה עלול לפגוע בכם בסופו של דבר.

ככל שהתוכן יותר ייחודי ומקורי, כך גדלים סיכוייו לקבל את הנראות הגבוהה ביותר ואת מדדי הסמכות והאמינות הגבוהים ביותר. שווה!

איך מוצאים תוכן משוכפל

יש כמה דרכים עיקריות לעשות זאת, מעבר לדרכים הנוספות שיתוארו בהמשך:

  • חיפוש פשוט בגוגל – מעתיקים משפט כלשהו ומחפשים אותו בגוגל, חובה עם מרכאות בהתחלה ובסוף כדי למצוא בדיוק את מה שאתם מחפשים. אם מישהו העתיק מכם, תגלו זאת מייד.
  • Copyscape – אחד מהכלים הידועים ביותר הוא Copyscape, המאפשר לבצע כמה בדיקות חינמיות טרם יבקש מכם תשלום. פשוט מדביקים את כתובת העמוד בכלי, והוא יציג לכם את כל המקורות שהעתיקו מכם (בהנחה שיש כאלה).
  • כלים המבצעים SEO Audit – כלים אלו מיועדים למצוא שכפולי תוכן בתוך האתר ולא מחוצה לו. לאחר שהאתר נסרק מתקבלות תוצאות לטיפול. כלים לדוגמה: Rank Ranger, Ubersuggest וכן הלאה.

copyscape

בעיות של תוכן משוכפל מחוץ לאתר

ככל שזה נוגע לאתרים ונכסים חיצוניים, תוכן משוכפל בא לידי ביטוי בשלוש דרכים עיקריות. כך תטפלו בהן.

גניבת תוכן ידנית או אוטומטית

סקרייפרים קיימים כמעט מראשית ימי האינטרנט, והם משתכללים והולכים עם חלוף הזמן. הם פשוט סורקים כמויות גדולות של עמודי אינטרנט, מעתיקים את התוכן ומאפשרים לצד האחר להשתמש בו כאילו היה שלהם. למרבה האירוניה, זה בדיוק מה שגוגל עושה כדי להציג פרסומות בתוצאות החיפוש.

יש כמה דרכים להילחם בכך:

  • הגשת דוח הפרת זכויות יוצרים בגוגל, בתקווה שהתוכן המשוכפל יוסר. בדרך כלל מדובר בעבודה סיזיפית ולא פשוטה, שלא מבטיחה שבסיומה תקבלו את מה שרצית.
  • לא לעשות כלום בתקווה שגוגל יזהה את המקור האמיתי של התוכן וייתן לו את הקרדיט הראוי. הבעיה שבמקרים מסוימים, התוכן המועתק מתברג אפילו גבוה יותר מהמקורי.
  • שימוש בקישורים פנימיים אבסולוטיים, כלומר בעלי כתובת URL מלאה ולא חלקית בלבד. כאשר הסקרייפר מעתיק את העמוד, הוא מעתיק הכול – ואם הצד השני לא מקפיד בציציות, הוא עשוי להדביק את התוכן שלכם יחד עם הקישורים האבסולוטיים שמובילים חזרה… לאתר שלכם. אותו דבר לגבי שימוש בתגי קנוניקל בכל עמודי האתר.
  • פנייה לגנב ודרישה להסרת התוכן לפני נקיטת פעולה משפטית. כאן תצטרכו קודם כל להוכיח שאתם המקור, אם באמצעות תאריך הפרסום באתר ואם באמצעים אחרים כגון ארכיון האינטרנט.
  • שכתוב התוכן בעמוד שלכם במטרה לשנות אותו בהשוואה לתוכן שהועתק מכם. זה יכול להיות סביר אם מדובר בפסקה או שתיים (או חמש); אבל אם מדובר באלף או יותר מילים – אתם תידרשו לעבודה כפולה ומכופלת בכל פעם שמישהו יעתיק מכם.

סינדיקציית תוכן

עד היום נהוג להפיץ מאמרים ותכנים במקורות משניים, נוסף לאתר המקורי. בחו"ל יש שירותי PR Newswire שמוקדשים לדברים האלה, ומפיצים מאמר אחד במאות מקורות שונים. כמובן שאם המטרה היא שיווק ולא SEO, אין בכך שום בעיה ואתם בהחלט יכולים להשתמש בשירותי סינדיקציה של תוכן.

אבל גם אם אתם כן מקפידים על SEO, הפצה של מאמר אחד במקור נוסף או שניים – לא תהווה נזק של ממש (אם כי זה כן מוריד את הנראות האורגנית שלכם, כמקור הייחודי של אותו תוכן).

לשם כך מומלץ שהגרסאות המועתקות יפורסמו לפחות זמן מה לאחר שהמאמר המקורי פורסם ואונדקס בגוגל (נגיד בהפרש של שבוע או שבועיים). בצורה כזו גוגל יידע שיש גרסה קנונית לתוכן הזה, ואתם מצמצמים את רוב הנזקים שהיו עלולים להתרחש.

בנימה אישית – אם כבר מדובר בהפצת מאמר / סינדיקציית תוכן: עדיף לכתוב תוכן חדש וייעודי רק למטרה זו. מוטב מאשר לקחת תוכן מהאתר הקיים.

תיאורי מוצרים גנריים

אחד מהסוגים הנפוצים ביותר של תוכן משוכפל, הוא תיאורי מוצרים גנריים שנלקחים שוב ושוב מאותו ספק / יצרן. התיאורים הללו מפורסמים במאות ואלפי אתרי קניות, והרי לכם מתכון לצמצום משמעותי בנראות האורגנית של כל עמודי המוצרים הללו.

מצד אחד אפשר להתגבר על הבעיה הזו באמצעות קישורים. אם תשיגו מספיק קישורים טובים, התוכן המשוכפל יהווה פחות ופחות בעיה עבור האתר. אבל מה קורה אם אתם מתמודדים מול אתר חזק מכם בכמה רמות? במצב כזה תיאלצו לחכות הרבה זמן עד שתגיעו לכמות ולאיכות הקישורים הדרושה; אז כל מה שנשאר לעשות הוא לשכתב את תיאורי המוצרים.

אם מדובר במאות ואלפי מוצרים, כמובן שזה ייקח זמן – אבל התוצאות יהיו שוות את המאמץ. לכל מוצר עם תוכן ייחודי (ומומלץ גם אטרקטיבי ורלוונטי) תהיה הזדמנות שווה להופיע בגוגל, ולגרוף עוד רכישות אונליין. זאת בניגוד למאות אלפי עמודי מוצר שבכולם יש אותו טקסט.

בעיות של תוכן משוכפל בתוך האתר

אומנם גוגל לא מבחין בין שכפולים באתר ומחוץ לאתר (שכפול זה שכפול), אבל כאשר מדובר באתר שלכם – יש לכם שליטה מלאה על המתרחש (בניגוד לאתרים חיצוניים). ברוב המקרים, תוכן משוכפל בתוך האתר הוא תוצר של ארכיטקטורה גרועה.

היררכיית אתר טובה היא הבסיס לאתר טוב וגם לקידום מוצלח. אם נבחר לתת לגוגל להחליט בעצמו מה טוב ומה לא, אנו עלולים להתמודד עם ההשלכות לאחר מכן. אל תשכחו שהאלגוריתמים של גוגל, מתוחכמים ככל שיהיו בשילוב בינה מלאכותית, עדיין עושים טעויות עד היום.

כפילויות בקטגוריות מוצרים

נניח שאתם מחפשים ספר שידריך אתכם כיצד להתקין מרצפות. באתר שאליו הגעתם יש כמה נתיבי ניווט שונים שמובילים לאותו ספר, כשלכל אחד מהם יש כתובת שונה. בצורה כזו נוצרים שכפולים מיותרים עבור אותו מוצר בדיוק:

https://www.site.com/flooring/bathroom/books/mybook

https://www.site.com/bathroom/books/flooring/mybook

https://www.site.com/books/flooring/bathroom/mybook

ככה הופכים אתר של 5,000 מוצרים – לאתר של 45,000 מוצרים. חראם!

צריך גם לזכור שיש תקציב זחילה מוגבל לכל אתר. אם נבזבז אותו על כפילויות מיותרות של מוצרים או תכנים, הזחלן לא יגיע לתוכן האמיתי, וייצא מהאתר לפני שהספיק לעשות משהו.

פתרון אחד הוא לתייג כל מוצר אך ורק בקטגוריה אחת ולא בכמה קטגוריות במקביל. זה אומנם מצוין מבחינת SEO, אבל פחות ידידותי למשתמש שיכול להגיע למוצר באמצעות כמה וכמה נתיבי ניווט שונים (שכולם רלוונטיים, כמובן).

פתרון טוב יותר הוא שכל מוצר יישב תחת כתובת URL אחידה, ללא תיאורי קטגוריות:

https://www.site.com/product/mybook

אומנם אנחנו מאבדים את "פירורי הלחם" של ה-URL, אבל גם ככה זה לא ממש קריטי; וממילא עדיף URL קצר ותמציתי ככל האפשר. אם נעשה זאת בכל המוצרים, נגדיל פי כמה את הנראות האורגנית שלהם בהשוואה לכתובות העמודים שהוצגו קודם לכן.

כמו כן מומלץ לשלב תגי קנוניקל שיפנו אל כתובת המוצר המקורית, מתוך כל גרסה משוכפלת. בצורה כזו נגדיל פי כמה וכמה את הסיכויים שמנועי החיפוש יבינו מה המוצר המקורי, ומיהם השכפולים שמהם אפשר להתעלם.

כפילויות URL

אחד מהבעיות הבסיסיות ביותר בארכיטקטורת אתר, קשורה לשאלה כיצד הדפדפן ניגש לדפים השונים. כברירת מחדל, ניתן להגיע כמעט לכל דף באתר באמצעות כתובת URL מעט שונה. אם לא נטפל בכך, כל URL שכזה יוביל לאותו עמוד בדיוק, עם אותו תוכן. ואז בום – תוכן משוכפל.

כפילויות בעמוד הבית לדוגמה:

http://site.com

http://www.site.com

https://site.com

https://www.site.com

העניינים מסתבכים בעמודים פנימיים, כאשר ניתן להוסיף / להסיר גם את סימן הלוכסן בסיום:

http://site.com/page

http://site.com/page/

http://www.site.com/page

http://www.site.com/page/

וכן הלאה…

אומנם גוגל אמור לדעת לזהות את הבעיה, אבל זה לא תמיד קורה בפועל. הפתרון הוא לבצע הפניות 301 ולשמור על אחידות בקישורים הפנימיים. חוץ מהשימוש הנוסף גם בתגי קנוניקל, רצוי ואף חובה לוודא שכל הגרסאות של אותו עמוד יפנו לגרסה אחת תקינה.

כשמבצעים הפניות בין הגרסאות השונות, יש לוודא שכל גרסה מפנה לגרסה התקינה – בלי שרשראות של הפניות מיותרות. אחרת אתם מעמיסים על השרת וגם על הזחלן של מנועי החיפוש, מה שעלול למנוע סריקה תקינה של האתר.

כמו כן יש לוודא שכל קישור פנימי יהיה אבסולוטי (כולל https וכו') אל הגרסה הנכונה של העמוד.

פרמטרים של URL

לפני שנים, חלק ניכר מהאתרים הכיל פרמטרים ושרשורי URL שיצרו בעיות של תוכן משוכפל. אם בהתחלה היה מדובר ב-session id, היום כבר מדובר בפרמטרים אחרים: סימני שאלה ?, סימני שוויון =, סימן החיבור באנגלית & וכן הלאה.

פרמטרים מאפשרים לשאוב ולהציג נתונים שונים באותו עמוד, בדרך כלל בהתבסס על מסננים או בחירות מרובות. לדוגמה, העמוד site.com/shirts/ יכול לקבל כמה פילטרים שונים: אחד לפי סינון של צבע, גודל וסגנון – ועוד אחד לפי סינון של מחיר וכמות מוצרים להצגה:

Site.com/shirts/?color=red&size=small&style=long_sleeve

Site.com/shirts/?sort=price&display=12

חמור מכך – אם נשנה את סדר הבחירה / הסינון, הפרמטרים ישנו את מיקומם בתוך אותו URL.

כדי לפתור את הבעיה ניתן לבצע כמה דברים:

  • תגי קנוניקל.
  • תגי noindex.
  • כתובת URL קבועה ונפרדת לווריאציות הכי מבוקשות של כל מוצר.
  • פתרון מבוסס JS / Ajax (בתנאי שעובדים עם מערכת ידידותית למנוע חיפוש).
  • קישורים פנימיים לחיזוק ה-URL הנכון, למרות שהוא מכיל פרמטרים.
  • פירורי לחם עם סכמה מתאימה.

לפירוט מלא כיצד לעשות זאת – היכנסו למדריך שלנו >

דפי נחיתה לממומן ו/או דפי ספליט טסט

לעיתים קרובות מוסיפים לדומיין גם דפי נחיתה שמיועדים לפרסום ממומן או מבחני a/b, בכמה גרסאות דומות עם שינויים קטנים בין גרסה לגרסה. אומנם זה בדרך כלל אומר שדפים אלו הם יתומים (כלומר לא מחוברים לשום מקום באתר), אבל זה לא אומר שמנועי חיפוש לא יצליחו לגלות את קיומם.

הפתרון הוא לתייג אותם בתגית noindex.

בהצלחה!

מבוסס בין היתר גם על מדריך באתר SEJ

אודות הכותב
אייל רחמים
אייל רחמים

בעל ניסיון של 14 שנים בשיווק דיגיטלי ו11 שנים בקידום אתרים, יזם דיגיטלי, מנכ״ל דיגיטאץ׳ – חברה לקידום אתרים ושיווק באינטרנט, מרצה במכללה למנהל, והבעלים של הבלוג seolinks.

קידום אתרים בגוגל למעלה

רוצים יותר כניסות לאתר?

מדריך ללימודי קידום אתרים
רוצים שאבדוק לכם את האתר?