למידת מכונה

חיזוי ערכים רציפים - מחירי דג הרינג 🐟

במסגרת קורס למידת מכונה (מפוקחת) אצל ד״ר אבשלום אלמלח קיבלנו משימת אמצע לחזות ערכים רציפים באמצעות השוואה בין מספר מודלים רגרסיביים. מטלה זו איפשרה לנו, לראשונה למעשה, להתנסות באופן מעשי בתהליך המחקרי שמאפיין את עבודתו של מדען נתונים – החל מניתוח נתונים ראשוני (EDA), דרך בניית מודלים ועד להשוואת ביצועים. תרגיל חיזוי מחיר קופסת הרינג דני, חובב הרינג, הבחין כי לקוחות שונים משלמים מחירים שונים על קופסת הרינג האהובה עליו. המוכר הסביר לו שהמחיר נקבע לפי סוג ההרינג ולפי התאמה אישית המבוססת על 10 פרמטרים. דני ביקש מיוסי לאסוף נתונים – 1000 תצפיות עם 10 פרמטרים לכל תצפית ועמודת מחיר. ...

בחירת תכונות עם Forward Selection - למה זה חשוב?

בעולם הדינמי של ניתוח נתונים ולמידת מכונה, בחירת המשתנים הנכונים למודל היא שלב קריטי שמשפיע על ביצועי המודל, על פשטותו, ועל משאבי החישוב הדרושים לו. מערכי נתונים מודרניים עשויים לכלול עשרות ואף מאות משתנים, אך לא כולם תורמים בפועל לדיוק החיזוי. Forward Selection היא שיטה מתקדמת לבחירת משתנים, שמאפשרת לבנות מודל פשוט ויעיל תוך התמקדות במשתנים המשמעותיים ביותר. במאמר זה נסקור את השיטה, נבין את היתרונות והחסרונות שלה, ונתמקד ביישום מעשי בתהליך הרגרסיה. ...

מבוא תיאורטי ללמידה מפוקחת

מבוא למידה מפוקחת (Supervised learning) היא סוג של למידת מכונה שבה הערכים שצריך לחזות כבר ידועים, והמטרה היא לבנות מודל שמסוגל לחזות בצורה מדויקת ערכים של נתונים שטרם נראו. למידה מפוקחת עושה שימוש במאפיינים (features) על מנת לחזות את הערך של משתנה המטרה (target variable), כמו למשל חיזוי מיקומו של שחקן כדורסל על פי ממוצע הנקודות שלו למשחק. סוגי למידה מפוקחת ישנם שני סוגים של למידה מפוקחת: סיווג (Classification)- משמש לחיזוי התווית או הקטגוריה של תצפית. לדוגמה, ניתן לחזות האם עסקה בנקאית היא הונאה או לא. מכיוון שיש כאן שני תוצאות אפשריות – עסקה הונאתית או עסקה שאינה הונאתית – זה נקרא סיווג בינארי. רגרסיה (Regression)- משמשת לחיזוי ערכים רציפים. לדוגמה, מודל יכול להשתמש במאפיינים כמו מספר חדרי השינה וגודל הנכס כדי לחזות את משתנה המטרה – מחיר הנכס. שפה שימו לב כי מה שאנחנו מכנים מאפיין (feature), אחרים עשויים לכנות משתנה מנבא (predictor variable) או משתנה בלתי תלוי (independent variable). בנוסף, מה שאנחנו מכנים משתנה מטרה (target variable), אחרים עשויים לכנות משתנה תלוי (dependent variable) או משתנה תגובה (response variable). ...