Wednesday, May 29, 2013

Haaretz 28-5-2013 and misleading graphs

בכתבה בהארץ מתאריך 28-5-2013 (קישור) יש גרף.
הגפיקה יפה לעין. הרוחב של הסיגריות אחיד ואין בעיה של נפח לא פרופורציוני, כפי שקורה לעתים קרובות בגרפים מסוג זה. אז מה הבעיה ולמה אני מתעצבן?

יש שתי בעיות:
1. בילבול מכוון של הקורא בשם הגרפיקה היפה
2. אי שימוש בגרף מעניין

1. בילבול מכוון


הגרפיקאים החליטו שהם רוצים סיגריות עם פילטרים.זה מאפשר לו להראות בצורה גרפית יפה את ההבדל בין השנים. אבל ערכים נמוכים, כמו עישון של נשים ערביות, היו גורמים לו להציג רק חלק מהפילטר. לכן נעשתה החלטה שקו הפילטר של הסיגריה יהיה נקודת האפס של הגרף.
זה לא ברור כלל לצופה הממוצע. על כן, יש הטעיה ויזואלית של הערכים. לעתים (עבור ערכים קטנים) בסדרי גודל של 2 ו-3.
אני יכול להבין את הרצון להשתמש בפילטרים אבל לשם בהירות הגרף חשוב לציין את נקודת האפס. למשל (סלחו לי אני לא גרפיקאי):

2. אי שימוש בגרף מעניין

מה אומרת כותרת הכתבה (דו"ח חדש מצביע על ירידה חדה בשיעור המעשנים בישראל)? מה המידע הדרמטי והמעניין כאן? שיש ירידה משמעותית בין שני הסקרים בעישון. שיש עליה גדולה מאד בעישון נשים ערביות וירידה חדה בקרב נשים יהודיות...
מה הגרף האידיאלי לזה? גרף של אחוז שינוי משנה קודמת. אולי כתוספת לגרף הנוכחי (בהנחה שאחוז שינוי זה ערך שנה נוכחית פחות קודמת, כל זה מתחלק בשנה קודמת). הנה דוגמא מאד לא יפה שעשיתי ב2 דקות באקסל:
פתאום רואים מה השינוים המשמעותיים בצורה ברורה.

שני הגרפים תורמים כאן. המקורי מדגיש את ההבדלים בין האוכלוסיות השונות. הגרף הנוסף מדגיש את השינוי בין הסקרים.


1 comment:

  1. יפה מאוד.
    השמאלנים האלה...

    ReplyDelete