קבל דוח בחינם
כניסת לקוחות
Phone Link Icon 050-8127373
Lang Icon EN
מה זה TF-IDF והאם הוא עדיין רלוונטי בעולם קידום האתרים?
מה זה TF-IDF והאם הוא עדיין רלוונטי בעולם קידום האתרים?

מה זה TF-IDF והאם הוא עדיין רלוונטי בעולם קידום האתרים?

בהמשך ישיר למאמרים שלנו בנושא הSEO הטכני, היום נסקור את אחד המדדים המעניינים ביותר בתחום שרבים סולדים ממנו וטוענים שהוא מיושן ולא רלוונטי, אך לטעמי הוא יכול לעזור פעמים רבות כאשר אנחנו רוצים לבצע אופטימיזציה On-Page ומעוניינים למטב את העמודים השונים באתר שלנו בעבור מילות מפתח מסוימות.

הערה חשובה- גו'ן מולר התייחס בעבר לשימוש בTF-IDF והבהיר מספר היבטים חשובים במיוחד וכיצד גוגל רואה את המדד בעיניים שלה.

לפני מספר שנים, מומחים רבים בתעשיית הSEO השתמשו בנוסחת "צפיפות מילות מפתח" אשר עזרה באבחון של כמות מילות המפתח בעבור טקסט נתון וכך למעשה צפתה את המשקל של אותה מילה והחשיבות שלה באותו עמוד.

מעוניין בקידום אורגני בגוגל? השאר פרטים

    • מינימום 2 תווים
    • שדה חובהנא להזין מינימום 10 ספרות

    למרות ששימוש בנוסחת צפיפות מילות המפתח נראה הגיוני, הוא לחלוטין לא הדרך בה הזחלנים של גוגל סורקים אתרים ונוסחה זה למעשה בנויה בצורה המעותת לגמרי את הדרך שלנו לנסות ולהתחקות אחר הזחלנים ואנשי SEO רבים נעזרים בנוסחה המתקדמת יותר-TF-IDF כפי שתוכלו לראות במאמר המצוין של MOZ.

    העיוות הזה ושורה של בעיות נוספות, הביאו אלינו נוסחה חדשה הפותרת את הבעיות המרכזיות של נוסחת "צפיפות מילות המפתח" ומאפשרת לנו לאבחן את המשקל של מילות המפתח בעמוד בצורה חכמה  ומתוחכמת הרבה יותר ביחס לעמודים בכל רחבי הרשת (דגימה מספרית מסוימת כמובן:)) באמצעות נוסחת הTF-IDF.

    הנוסחה הזאת נמצאת אצל סוכנות ומקדמי אתרים לפעמים בהערכת חסר, והSearch Engine Land הכתיר אותו כמדד הטוב ביותר לביצוע אופטימיזציית און פייג' שמומחי SEO לא מנצלים.

     TF-IDF: The best content optimization tool SEOs aren’t using

    [toc]

    אז מה זה TF-IDF?

    הTF-IDF הוא מדד מספרי המבוסס על נוסחה מתמטית אשר הומצאה כדי לחזות את חשיבות מילה מסוימת עבור עמוד  בקולקציה של עמודים. בפועל, המדד למעשה מגדיל את המשקל של המילה על בסיס כמות הפעמים שהיא מופיעה ומוריד את החשיבות שלה על בסיס כמות העמודים בהם היא מופיעה. הפחתה זו חשובה במיוחד ופותרת את הבעיה שמילים מסוימות מופיעות כמעט בכל רחבי האינטרנט ונמצאות בשימוש נפוץ במיוחד.

    מנועי החיפוש וביניהם כמובן גוגל, משתמשים בכל מיני וריאציות של הנוסחה הזו (וכמובן של נוסחאות רבות אחרות) כדי לאבחן את חשיבות במילה במכלול העמודים ברשת האינטרנט. 

    במילים אחרות, מדד זה הוא ככל הנראה אחת ממכלול נוסחאות שחלקן חדשות וחלקן ישנות יותר העוזר לאלגוריתם להבין את חשיבות הביטוי במכלול מתוחכם יותר מאשר מספר כמותי בנאלי של %.

    בתכל'ס – המדד הזה הוא אחד ממאות כלים של גוגל לאבחן את חשיבות מילה מסוימת בטקסט.

    הנוסחה עצמה

    אחרי כל ההקדמות הגענו לנוסחה עצמה שתעזור לכם להבין טיפה את אופן החישוב בצורה יותר חכמה.

    בתמונה, מצורף הסבר מעניין על הנוסחה מתוך אתר הטכניון.

    הסבר על נוסחת הTF-IDF

    • הTF הוא למעשה Term Frequency כלומר כמות הפעמים שהביטוי מופיע בטקסט (בחישוב קצת יותר מתקדם)

    תדירות השימוש במילה מסוימת או ביטוי מסוים מחושבת עפ"י הנוסחה הבאה:

    Term Frequency (TF) Formula

    כמובן שלא תצטרכו לעשות את החישוב הזה בצורה ידנית ויש אלפי כלים שיעשו לכם את העבודה קלה ומידית. לצורך המחשה, נגיד ויש לכם ביטוי שמופיע 10 פעמים בטקסט של 1000 מילים, הTF שלו בבסיס לוג 2 יהיה 0.43. במידה ותכפילו את השימוש במילה ערך הTF יעלה ל0.53.

    על פניו, המדד מאפשר לנו להבין אם אנחנו משתמשים בביטוי יותר מידי או פחות מידי אבל ללא מדד הIDF לא באמת נוכל לדעת את החשיבות של הביטוי וזה מה שאנחנו מחפשים.

    • הIDF-  הוא קיצור של inverse document frequency כלומר מדד הבוחן את מספר העמודים אשר מכילים את הביטוי ומחושב על פי הנוסחה הבאה:

    Inverse Document Frequency (IDF) formula

    שוב, גם פה נעזוב את המתמטיקה בצד. אם מילה מסוימת מופיעה במספר רב של אתרים, כמו למשל המילה "אתרים", ערך הIDF יהיה מאוד נמוך ולכן במכפלה שלו עם ערך הTF ההשפעה שלו על חשיבות המילה תיהיה מזערית. לעומת זאת, כאשר הביטוי מופיע במספר עמודים נמוך יחסית, ערך הIDF יהיה גבוה וההשפעה שלו על חשיבות המילה בעמוד (ערך הTDF-IDF) תיהיה גבוהה.

    אם התבלבלתם קצת מרוב מתמטיקה, אעשה סדר קטן ופשוט.

    הIDF יהיה קטן יותר ככל שמספר העמודים שהביטוי מופיע בו גדול יותר ביחס לכל העמודים וכך ההשפעה שלו על מדד הTF תיהיה קטנה יותר. כך למעשה ההשפעה של מילים נפוצות במיוחד מנוטרלת.

    יופי, אז מה הקשר לקידום אתרים?

    הנוסחה בפני עצמה היא בהחלט יפה, אבל השימוש שלה בעולם שלנו יכול להיות יעיל מאוד אם נשכיל להבין את היתרונות והחסרונות שלה. הנוסחה בעצם עוזרת לנו להבין את מידת הרלוונטיות של ביטוי בתוך עמוד תוכן, רלוונטיות היא מילת מפתח משום שהמטרה של גוגל וכל מנועי החיפוש היא לתת את התוצאה הרלוונטית ביותר לשאילתת החיפוש של הגולש.

    כלומר, הנוסחה מאפשרת לנו לנתח עמוד מסוים מהעיניים הווירטואליות של הבוטים של גוגל ולבצע אופטימיזציית רלוונטיות מתקדמת לכל עמוד ועמוד. 

    בתמונה: בחינה של הערך מול שאר המתחרים בעמוד בעבור הביטוי "קידום אתרים" ובעבור עשרות ביטויים קשורים באמצעות התוכנה WebSite Auditor (כל צבע מייצג אתר אחר)

    Seo Power Suit

    תוכלו לראות די בבירור שכל המתחרים נעים באותו טווח TF-IDF פחות או יותר בביטוי המרכזי.

    איך נעשה אופטימיזציה באמצעות TF-IDF?

    ניתן להסביר אינספור דרכים שהנוסחה הזאת יכולה לעזור לכם במידה מסוימת, אבל אני אשאיר לכם את היצירתיות. השיטה הכי יעילה היא בעצם לנתח את התוצאות של המתחרים שלכם ביטוי ולראות את הערך שהם מקבלים בעבור עמוד מסוים ולהתחיל לבצע ניסויים. ההגיון הוא פשוט, עם התוצאה שהם קיבלו הובילו אותם למקום הראשון, ככל הנראה שתוכלו לבצע אופטימיזציה באמצעות שינוי התוכן בעמוד שלכם וכיוונן לאזור הערך שלהם. 

    שימו לב- כמובן ששינוי ערך אינו מבטיח עלייה בדירוגים ואין לנו באמת דרך לדעת את ההשפעה של הפעולות שנבצע על התוצאות שנקבל כפי שתוכלו לראות בניסוי של DiggityMarketing.com .

    השיטה שלנו היא למעשה להתאים את התוכן בצורה הטובה ביותר ומירב עבודת האופטימיזציה שלנו תהיה סביב נושא התוכן כמובן. לאחר שיש לנו תוכן קיים השלב השני יהיה לבחון את הנתונים ואת המדד ולבצע התאמות נדרשות בעבור הביטוי שאנחנו רוצים לקדם. לאחר מכן, נבחן עוד פעם את תוצאות השינוי ונבצע התאמות נוספות (שימו לב שבניסויים רבים בנושא אובחנה ירידה לאחר השינוי ורק לאחר מכן עלייה בדירוגים, בדומה לפעולות קידום נוספות)

    מוזמנים לצפות בסרטון המסביר בצורה די טובה כיצד לבצע אופטימיזציה לאתר באמצעות הWebsite Auditor:

     

    ממה כדאי להיזהר?

    שימו לב!

    כאשר אתם מבצעים אופטימיזציה לביטוי מסוים יכול להיות שאתם מבצעים די-אופטימיזציה לביטוי אחר ולכן חשוב לקבוע סדרי עדיפויות ולבצע את התהליך בבקרה מריבית.

    לסיכום, הדעה האישית שלי על TF-IDF

    מדד זה בהחלט מעניין ונמצא בשימוש אצל אנשי SEO רבים. לדעתי האישית, מדובר במדד טוב שנותן זווית טכנית נוספת אך לא מומלץ לבסס את כל פעולות האון-סייט שלכם עליו. מהנסיון שלי, מחשבה אמיתית על הגולש ונתינת ערך אמיתי בסופו של דבר מחזירה את פירות ההשקעה בצורה הטובה ביותר. באורח פלא, איכשהו כאשר כותבים ויוצרים תוכן איכותי המדדים מתיישרים בצורה די טבעית. אם אתם מקדמים אתר בחו"ל, מומלץ לנסות ולבחון את המתחרים באמצעות המדד. באופן אישי, אני משתמש במדד הזה בעיקר לביצוע אופטימיזציה של עמודים ישנים וביצירת תוכן חדש מעדיף לנסות את הדרך הטבעית והנקייה בהתחלה. 

     

    אודות הכותב
    אייל רחמים
    אייל רחמים

    בעל ניסיון של 14 שנים בשיווק דיגיטלי ו11 שנים בקידום אתרים, יזם דיגיטלי, מנכ״ל דיגיטאץ׳ – חברה לקידום אתרים ושיווק באינטרנט, מרצה במכללה למנהל, והבעלים של הבלוג seolinks.

    קידום אתרים בגוגל למעלה

    רוצים יותר כניסות לאתר?

    מדריך ללימודי קידום אתרים
    רוצים שאבדוק לכם את האתר?