Diese Präsentation wurde erfolgreich gemeldet.
Wir verwenden Ihre LinkedIn Profilangaben und Informationen zu Ihren Aktivitäten, um Anzeigen zu personalisieren und Ihnen relevantere Inhalte anzuzeigen. Sie können Ihre Anzeigeneinstellungen jederzeit ändern.

Big data romi mik_ifish

1.059 Aufrufe

Veröffentlicht am

מה משמעות המונח Big Data ואיך הוא קשור ליום יום שלנו? בהרצאה נפגוש כמה מהדוגמאות הבולטות בהן נעשה שימוש בביג דאטה בתחומים שונים, נסקור שימושים שעושות חברות מסחריות וממשלתיות במידע ונדבר גם על ההזדמנויות והסכנות העומדות בפני החברה האנושית ההולכת ונשענת על אלגוריתמים בקבלת החלטות. החלק האחרון של ההרצאה יוקדש ל"אינטרנט של הדברים" (iot) - המגמה הבאה בעולם המחשוב בה מכשירים רבים סביבנו יחוברו לרשת. האינטרנט של הדברים קשור קשר הדוק ל-Big Data - משום שכדי להפיק תובנות בעלות ערך נזדקק למערכת חכמה ומהירה אף יותר שתביא לערך המוסף בחיבוריות של האובייקטים.

המרצה ד"ר רומי מיקולינסקי היא חוקרת, מרצה וכותבת. עמיתת מחקר במרכז המצוינות LINKS I-CORE (למידה בחברה מקושרת). מרצה בחוג לתקשורת באוניברסיטת בן גוריון ובבצלאל על תרבות דיגיטלית וטכנולוגיות תקשורת חדשות. rominating.tumblr.com

Veröffentlicht in: Technologie
  • Als Erste(r) kommentieren

Big data romi mik_ifish

  1. 1. Big Data–‫הבאה‬ ‫המהפכה‬ ‫ד‬"‫מיקולינסקי‬ ‫רומי‬ ‫ר‬ ‫מפגש‬‫פורום‬IFISH 17/6/15
  2. 2. ‫היום‬ ‫עושים‬ ‫מה‬? •‫הקדמה‬ •‫עידן‬‫המידע‬,‫המידע‬ ‫עומס‬ •Big Data •‫הדברים‬ ‫של‬ ‫אינטרנט‬((iot •‫שאלות‬?
  3. 3. ‫הקדמה‬
  4. 4. ‫היכרות‬
  5. 5. ‫היכרות‬
  6. 6. The Hype
  7. 7. The Hype
  8. 8. Gartner’s Hype Cycle 2014
  9. 9. Gartner’s Hype Cycle Explained
  10. 10. Gartner’s Hype Cycle 2013
  11. 11. Gartner’s Hype Cycle 2013
  12. 12. ‫הכמות‬ ‫על‬ ‫גם‬ ‫תשפיע‬ ‫הדברים‬ ‫אינטרנט‬ ‫של‬ ‫המואצת‬ ‫ההתפתחות‬ ‫הדיגיטלי‬ ‫במרחב‬ ‫שימושיים‬ ‫נתונים‬ ‫של‬ ‫האדירה‬,‫מידע‬ ‫כלומר‬ ‫שניתן‬‫אותו‬ ‫לנתח‬. ‫בשנת‬2013‫רק‬22%‫למידע‬ ‫נחשב‬ ‫בעולם‬ ‫הדיגיטלי‬ ‫מהמידע‬ ‫לנתחו‬ ‫שניתן‬ ‫שימושי‬,‫מ‬ ‫פחות‬ ‫כאשר‬-5%‫השימושיים‬ ‫מהנתונים‬ ‫בפועל‬ ‫מנותחים‬ ‫אכן‬.‫כלומר‬,‫לא‬ ‫נותרת‬ ‫נתונים‬ ‫של‬ ‫אדירה‬ ‫כמות‬ ‫מנותחת‬,‫כמעין‬"‫אפל‬ ‫חומר‬"‫הדיגיטלי‬ ‫היקום‬ ‫של‬. "‫המכונות‬ ‫עליית‬:‫הדיגיטלי‬ ‫מהמידע‬ ‫עשירית‬‫ב‬-2020‫הדברים‬ ‫מאינטרנט‬ ‫יווצר‬" ‫רפאל‬‫קאהאן‬,‫אפריל‬2014,‫כלכליסט‬ http://www.calcalist.co.il/internet/articles/0,7340,L-3628788,00.html ‫רקע‬ ‫קצת‬
  13. 13. ‫שנת‬ ‫עד‬2020,‫המחקר‬ ‫צופה‬,‫מ‬ ‫יותר‬-35%‫יחשבו‬ ‫הנתונים‬ ‫מכלל‬ ‫מועילים‬ ‫כנתונים‬,‫באינטרנט‬ ‫שמקורו‬ ‫המידע‬ ‫לגידול‬ ‫הודות‬ ‫הדברים‬.‫ועסקים‬ ‫ארגונים‬ ‫בה‬ ‫במידה‬ ‫תלוי‬ ‫יהיה‬ ‫זה‬ ‫זאת‬ ‫עם‬ ‫יחד‬ ‫ולנתחם‬ ‫אלו‬ ‫בנתונים‬ ‫להשתמש‬ ‫יבחרו‬. ‫הערכת‬‫היא‬ ‫המחקר‬,‫כי‬-40%‫רמה‬ ‫כיום‬ ‫דורשים‬ ‫הדיגיטלי‬ ‫ביקום‬ ‫מהנתונים‬ ‫הגנה‬ ‫של‬ ‫מסוימת‬,‫מהמידע‬ ‫מחצית‬ ‫רק‬ ‫אולם‬-20%‫בלבד‬-‫בפועל‬ ‫מוגן‬. "‫המכונות‬ ‫עליית‬:‫הדיגיטלי‬ ‫מהמידע‬ ‫עשירית‬‫ב‬-2020‫מאינטרנט‬ ‫יווצר‬‫הדברים‬" ‫קאהאן‬ ‫רפאל‬,‫אפריל‬2014,‫כלכליסט‬ http://www.calcalist.co.il/internet/articles/0,7340,L-3628788,00.html
  14. 14. ‫סין‬,‫הודו‬,‫מקסיקו‬,‫המידע‬ ‫מרבית‬ ‫את‬ ‫ייצרו‬ ‫ורוסיה‬ ‫ברזיל‬ ‫הדיגיטלי‬ ‫נתונים‬ ‫יותר‬ ‫ייצרו‬ ‫מתפתחים‬ ‫שווקים‬ ‫מפתיע‬ ‫באופן‬:‫להיום‬ ‫נכון‬ 60%‫מפותחים‬ ‫לשווקים‬ ‫מיוחס‬ ‫הדיגיטלי‬ ‫ביקום‬ ‫הנתונים‬ ‫מייצור‬ ‫גרמניה‬ ‫כמו‬,‫וארה״ב‬ ‫יפן‬.‫אולם‬,‫שנת‬ ‫עד‬2020‫מהפך‬ ‫צפוי‬,‫כאשר‬ ‫ברזיל‬ ‫כדוגמת‬ ‫המתפתחים‬ ‫השווקים‬,‫סין‬,‫הודו‬,‫ורוסיה‬ ‫מקסיקו‬, ‫הדיגיטליים‬ ‫הנתונים‬ ‫מרבית‬ ‫ליצירת‬ ‫אחראים‬ ‫יהיו‬. "‫המכונות‬ ‫עליית‬:‫הדיגיטלי‬ ‫מהמידע‬ ‫עשירית‬ ‫ב‬-2020‫מאינטרנט‬ ‫יווצר‬‫הדברים‬"‫רפאל‬‫קאהאן‬,‫אפריל‬2014,‫כלכליסט‬ http://www.calcalist.co.il/internet/articles/0,7340,L-3628788,00.html
  15. 15. ‫מעל‬50‫ב‬ ‫מחוברים‬ ‫מכשירים‬ ‫ביליון‬-2020
  16. 16. ‫המידע‬ ‫עידן‬,‫המידע‬ ‫עומס‬
  17. 17. ‫האינטרנט‬-‫אמת‬ ‫בזמן‬ http://pennystocks.la/internet-in-real-time/
  18. 18. Big Data‫הגדרה‬ ‫בכמות‬ ‫לשימוש‬ ‫כולל‬ ‫שם‬ ‫הוא‬ ‫המונח‬ ‫מידע‬ ‫של‬ ‫עצומה‬,‫ממקורות‬ ‫איסופו‬ ‫שונים‬,‫ובאיכויות‬ ‫שונים‬ ‫בפורמטים‬ ‫שונות‬,‫אחסונו‬,‫עיבודו‬,‫קשרי‬ ‫מציאת‬‫ם‬, ‫ולבסוף‬ ‫מתוכו‬ ‫תובנות‬ ‫והסקת‬ ‫תבניות‬ ‫אופרטיבית‬ ‫בצורה‬ ‫אלו‬ ‫בתובנות‬ ‫שימוש‬
  19. 19. ‫מקורות‬‫המידע‬
  20. 20. ‫מקורות‬‫המידע‬
  21. 21. ‫סיפור‬‫על‬‫שימור‬‫מידע‬,‫דיגיטציה‬‫ודאטפיקציה‬ Kenneth Cukier: Big Data is Better Data https://youtu.be/8pHzROP1D-w
  22. 22. ‫על‬ ‫נחשוב‬ ‫בואו‬‫מידע‬ ‫והעברת‬ ‫גיבוי‬ ‫ועל‬ ‫המידע‬ ‫העברת‬ ‫תהליך‬ ‫על‬ ‫נחשוב‬ ‫בואו‬ ‫השינויים‬‫האחרונות‬ ‫השנים‬ ‫בעשרים‬ ‫שעבר‬. ‫בעבר‬ ‫מידע‬ ‫וגיבו‬ ‫שמרו‬ ‫איך‬ ‫זוכרים‬ ‫ודאי‬ ‫אתם‬? ‫כמה‬‫קובץ‬ ‫לשמור‬ ‫לקח‬ ‫זמן‬,‫להעביר‬ ‫או‬ ‫לגבות‬ ‫אותו‬?
  23. 23. ‫המידע‬ ‫עידן‬ ‫במהלך‬‫העשור‬‫האחרון‬‫טכנולוגיות‬‫דיגיטליות‬‫שינו‬‫את‬‫העולם‬‫והגדירו‬ ‫מחדש‬‫את‬‫האופן‬‫בו‬‫אנשים‬‫מתקשרים‬,‫משתפים‬‫פעולה‬,‫עושים‬‫קניות‬, ‫מטיילים‬,‫קוראים‬,‫חוקרים‬,‫רואים‬‫סרטים‬,‫אוספים‬‫מידע‬,‫מזמינים‬ ‫חופשות‬,‫מנהלים‬‫את‬‫חשבונות‬‫הבנק‬‫שלהם‬‫ועוד‬‫ועוד‬. ‫במקביל‬‫הטכנולוגיות‬‫הדיגיטליות‬‫שינו‬‫את‬‫האופן‬‫בו‬‫חברות‬‫עסקיות‬ ‫ותאגידים‬‫מתנהלים‬‫מקצה‬‫אל‬‫קצה‬.‫בין‬‫התחומים‬‫שהושפעו‬:‫מכירות‬, ‫ניהול‬‫מלאי‬,‫שרשרת‬‫הייצור‬,‫ניהול‬‫מידע‬,‫קשר‬‫בין‬‫העובדים‬‫ועוד‬‫ועוד‬.
  24. 24. ‫עם‬ ‫דיל‬ ‫הביג‬ ‫מה‬ ‫אז‬Big Data?
  25. 25. ‫גוגל‬‫פלו‬‫טרנדס‬
  26. 26. Big Data–‫איך‬‫להפוך‬‫לארגון‬‫מונע‬-‫מידע‬?
  27. 27. Big Data‫בארגון‬ ‫בראש‬‫ובראשונה‬‫מדובר‬‫במידע‬‫הפנים‬-‫ארגוני‬ ‫ובניהולו‬.‫בין‬‫א‬‫ם‬‫מדובר‬‫בפעילות‬‫פנימית‬, ‫מחזורי‬‫כספים‬,‫פעילות‬‫מול‬‫הלקוחות‬‫או‬‫של‬ ‫הלקוחות‬–‫הגישה‬‫הרווחת‬‫אומרת‬‫לאסוף‬‫כל‬ ‫פריט‬‫מידע‬–‫ממידע‬‫כללי‬‫על‬‫פעילות‬‫הארגון‬ ‫או‬‫העסק‬‫ועד‬‫לרמת‬‫הלקוח‬‫הבודד‬ ‫המידע‬‫הכללי‬,‫או‬‫המידע‬‫האישי‬‫שנאסף‬‫על‬ ‫העובדים‬‫והלקוחות‬,‫ברובו‬‫מובנה‬‫וקל‬‫יחסית‬ ‫לשלוף‬‫אותו‬‫באמצעות‬‫שאילתות‬‫או‬ ‫אלגוריתמים‬.‫סוג‬‫המידע‬‫הזה‬‫בשימוש‬‫ברוב‬ ‫היחידות‬‫העסקיות‬‫בארגון‬:‫דנים‬‫בו‬,‫מנתחים‬ ‫אותו‬‫ומחליטים‬‫לפיו‬‫בשוטף‬ ‫מובנה‬ ‫מידע‬
  28. 28. Big Data‫בארגון‬ : ‫מובנה‬ ‫מידע‬ *‫עובדים‬ ‫מערכת‬ ‫ובאילו‬ ‫עליו‬ ‫אחראי‬ ‫מי‬ ‫ולהחליט‬ ‫המידע‬ ‫כל‬ ‫את‬ ‫ולארגן‬ ‫לשמור‬ ‫יש‬ *‫במקביל‬‫שלכם‬ ‫המידע‬ ‫מקורות‬ ‫את‬ ‫להרחיב‬ ‫נסו‬
  29. 29. Big Data‫בארגון‬ : ‫ונתונים‬ ‫מדדים‬ ‫שיותר‬ ‫כמה‬ ‫את‬ ‫לשמור‬ ‫נסו‬ key performance indicator (KPI)
  30. 30. Big Data‫בארגון‬ ‫מובנה‬ ‫הלא‬ ‫המידע‬-The Unstructured data ‫מדובר‬‫במידע‬‫שקיים‬‫בארגון‬,‫אך‬‫ללא‬‫הכנה‬ ‫ועיבוד‬(‫מניפולציה‬‫וניתוח‬)‫אין‬‫לו‬‫משמעות‬‫רבה‬. ‫בכדי‬‫שנוכל‬‫להפיק‬‫ממנו‬‫תובנות‬‫יש‬‫לשלב‬‫כלים‬ ‫ותהליכי‬‫ניתוח‬‫שימנפו‬‫את‬‫המידע‬‫הלא‬‫מובנה‬ ‫לכדי‬‫ידע‬‫בעל‬‫ערך‬. ‫לדוגמה‬:‫ניתוח‬‫מילים‬‫שאומרים‬‫לקוחות‬ ‫בעזרת‬‫כלי‬‫ניתוח‬‫קולי‬‫או‬‫ניתוח‬‫מילים‬‫שתועדו‬ ‫בגין‬‫שיחות‬‫עם‬‫לקוחות‬‫בעזרת‬‫כלי‬‫ניתוח‬ ‫טקסט‬.‫למעשה‬‫בחלק‬‫הזה‬‫מתבצעת‬‫פעילות‬ ‫חשובה‬‫ביותר‬‫לכל‬‫ארגון‬. ‫דאטה‬ ‫הביג‬ ‫לעולם‬ ‫המופלא‬ ‫המסע‬–‫דיגיטל‬ ‫לאומי‬ ‫בירן‬ ‫אייל‬ ‫מאת‬ http://tracks.roojoom.com/u/eyalbiran,8206/hms-hmvpl-lvlm-h-big-data-2,14805
  31. 31. Big Data‫בארגון‬ ‫מובנה‬ ‫הלא‬ ‫המידע‬-The Unstructured data ‫המידע‬‫הנאגר‬‫בשלב‬‫הזה‬‫עובר‬‫תהליכים‬‫של‬ ‫ניתוח‬‫ובהתאם‬‫לאלגוריתמים‬‫מתוחכמים‬ ‫ובעזרת‬‫כלים‬‫רלבנטיים‬‫מופקים‬‫ומקוטלגים‬ ‫מאותו‬‫מידע‬‫בודד‬‫מספר‬‫תוצאות‬‫משמעותיות‬ ‫יותר‬. ‫אותו‬‫מידע‬‫בודד‬‫הופך‬‫למעשה‬‫למידע‬‫עם‬ ‫משמעות‬.‫אותו‬‫נתון‬‫מובנה‬‫הופך‬‫למידע‬‫לא‬ ‫מובנה‬‫שנוצר‬‫על‬‫ידי‬‫מניפולציה‬‫על‬‫הנתונים‬. ‫כך‬‫נוצר‬‫מידע‬‫חדש‬.‫אותו‬‫מידע‬‫עובר‬‫עיבוד‬ ‫וכך‬‫יכול‬‫להפוך‬‫למשמעותי‬. ‫במסגרת‬‫עולם‬‫המידע‬‫שנוצר‬‫מעיבוד‬‫וניתוח‬ ‫ניתן‬‫לכלול‬‫גם‬‫ניתוח‬‫התנהגות‬‫לקוח‬‫בערוצים‬ ‫דיגיטליים‬‫כמו‬‫ניטור‬‫פעילות‬‫באינטרנט‬‫או‬ ‫במובייל‬,‫דפוסי‬‫גלישה‬‫והקלקות‬‫ועוד‬.
  32. 32. Big Data‫בארגון‬ ‫מכונה‬ ‫למידת‬/Machine Learning ‫כלים‬‫באמצעותם‬‫ממנפים‬‫את‬‫יכולות‬‫עיבוד‬‫המידע‬ ‫ומריצים‬‫באמצעותם‬‫אלגוריתמים‬‫שונים‬‫בכדי‬‫לזקק‬ ‫ולנתח‬‫מתוך‬‫כמויות‬‫גדולות‬‫של‬‫מידע‬‫באופן‬ ‫אוטומטי‬‫משמעויות‬‫ותובנות‬‫שונות‬
  33. 33. Big Data‫בארגון‬ ‫של‬ ‫מודלים‬Big Data ‫לאחר‬‫שכל‬‫המידע‬‫האפשרי‬‫מנותב‬‫ונאגר‬ ‫בארגון‬,‫מופעלים‬‫עליו‬‫מודלים‬‫שונים‬‫בכדי‬ ‫למקסם‬‫את‬‫התובנות‬‫העסקיות‬. ‫את‬‫המודלים‬‫הללו‬‫נהוג‬‫לחלק‬‫לכאלו‬ ‫המתבססים‬‫על‬‫פילוח‬(‫סגמנטציה‬)‫ולמודלים‬ ‫הפועלים‬‫על‬‫בסיס‬‫של‬‫חיזוי‬‫וניבוי‬ ‫כל‬‫המודלים‬‫הללו‬‫פועלים‬‫על‬‫פי‬‫המנגנון‬‫הבא‬: ‫איסוף‬‫המידע‬,‫ערבולו‬,‫הרצתו‬‫בכמויות‬‫גדולות‬ ‫בחלונות‬‫זמן‬‫מוגדרים‬,‫קטלוגו‬‫לעולמות‬‫תוכן‬ ‫והפעלת‬‫אלגוריתמים‬‫שונים‬‫של‬‫מחקר‬‫ולמידה‬ ‫על‬‫אותו‬‫מידע‬,‫בהתאם‬‫למודל‬‫שנבנה‬‫במקור‬ ‫ולשאלות‬‫העסקיות‬‫שהוגדרו‬‫ביציאה‬‫לדרך‬.
  34. 34. Big Data‫בארגון‬ ‫של‬ ‫מודלים‬Big Data ‫בחלק‬‫מהמודלים‬‫המידע‬‫מועבר‬‫הלאה‬ ‫בכדי‬‫שינתחו‬‫אותו‬‫ידנית‬‫ואחרים‬ ‫מציעים‬‫המלצות‬‫על‬‫בסיס‬‫חיזוי‬‫וניבוי‬ ‫מבוססי‬‫אוכלוסיות‬‫דומות‬‫והסתברות‬ ‫לפעילות‬‫מצד‬‫לקוח‬. ‫בין‬‫המודלים‬: ‫מניעת‬‫נטישה‬ ‫הגדלת‬‫פוטנציאל‬‫גיוס‬ ‫הגדלת‬‫פעילות‬ ‫בחירת‬‫המוצר‬‫הבא‬‫שיוצע‬‫ללקוח‬(‫כמו‬ ‫באמזון‬) ‫ניהול‬‫סיכונים‬ ‫מודלים‬‫של‬‫סגמנטציה‬‫נחשבים‬‫לבסיסיים‬ ‫והם‬‫נפוצים‬‫מאד‬:‫מודלים‬‫אלו‬‫עוסקים‬‫בפילוח‬ ‫לקוחות‬/‫משתמשים‬:‫מחלקים‬‫אוכלוסיות‬ ‫לרבדים‬‫שונים‬‫בכדי‬‫למקד‬‫הצעות‬‫ערך‬ ‫ולבנות‬‫פרופילים‬‫ומאפייני‬‫צרכנים‬
  35. 35. Big Data‫בארגון‬ ‫אופטימיזציה‬ "‫אופטימיזציה‬‫הינה‬‫מציאת‬‫מינימום‬‫או‬‫מקסימום‬‫לפונקציה‬‫תחת‬‫אילוצים‬‫נתונים‬" ‫לאחר‬‫הפעלת‬‫המודלים‬‫של‬‫ניבוי‬‫וחיזוי‬‫או‬‫סגמנטציה‬‫הארגון‬‫מגיע‬‫לתובנות‬ ‫עסקיות‬‫שאותן‬‫יש‬‫לבחון‬‫ולשפר‬.‫על‬‫הארגון‬‫לקחת‬‫בחשבון‬‫אילוצים‬‫הנובעים‬ ‫מהסביבה‬‫העסקית‬‫שלו‬‫ולניהול‬Big Data‫אפקטיבי‬‫עליו‬‫להחזיק‬‫גם‬‫בכלי‬ ‫שמבצע‬‫אופטימיזציה‬.‫כלי‬‫זה‬‫יוכל‬‫לעבד‬‫היקפים‬‫גדולים‬‫של‬‫מידע‬‫ולהכיל‬ ‫ולשקלל‬‫חוקים‬‫ומגבלות‬‫עסקיות‬‫משתנות‬‫יחד‬‫עם‬‫פרמטרים‬‫אחרים‬.‫כל‬‫זאת‬ ‫על‬‫מנת‬‫להגיש‬‫תוכנית‬‫שיווקית‬-‫עסקית‬‫אופטימלית‬‫למגוון‬‫ההצעות‬ ‫וההמלצות‬: ‫למשל‬-‫המינימום‬‫יכול‬‫להיות‬‫מינימום‬‫משאבים‬‫להפעלת‬‫קמפיין‬‫השיווקי‬ ‫המקסימום‬‫יכול‬‫להיות‬‫מקסימום‬‫רווחיות‬‫או‬‫תועלת‬‫בהתאם‬‫להצעות‬ ‫העסקיות‬‫המתועדפות‬‫להגשה‬ ‫האופטימום‬‫יהיה‬‫תוצר‬‫של‬‫תעדוף‬‫בין‬‫כל‬‫הפרמטרים‬‫והחוקים‬‫האפשריים‬ ‫כפי‬‫שיגדירו‬‫מדעני‬‫המידע‬‫באלגוריתם‬‫של‬‫כלי‬‫האופטימיזציה‬
  36. 36. Big Data‫בארגון‬ ‫אופטימיזציה‬ "‫אופטימיזציה‬‫הינה‬‫מציאת‬‫מינימום‬‫או‬‫מקסימום‬‫לפונקציה‬‫תחת‬‫אילוצים‬‫נתונים‬" ‫אם‬‫עולם‬‫ה‬-Big Data‫נבחן‬‫בין‬‫רמת‬‫השקעת‬‫משאבים‬‫וערך‬‫עסקי‬‫לפעילות‬, ‫יישום‬‫כלי‬‫האופטימיזציה‬‫מאפשר‬‫תזוזה‬‫בין‬‫עקומות‬,‫ולא‬‫רק‬‫על‬‫גבי‬ ‫העקומה‬. ‫משמע‬,‫בגין‬‫אותו‬‫אילוץ‬‫של‬‫משאבים‬‫או‬‫בגין‬‫אותה‬‫הצעת‬‫ערך‬‫תופק‬ ‫בסביבת‬‫אופטימיזציה‬‫תועלת‬‫גדולה‬‫יותר‬‫בפחות‬‫משאבים‬‫למימושה‬.
  37. 37. ‫סכנות‬
  38. 38. ‫פרטיות‬
  39. 39. ‫ה‬ ‫בעידן‬ ‫לפרטיות‬ ‫קורה‬ ‫מה‬-BigData? We’re well down this path already. The information we thought of as personal data in the past—our name, address, or credit card records—is already bought and sold by data brokers like Acxiom, a company that holds an average of 1,500 pieces of information on more than 500 million consumers. This is data that people put into the public domain on a survey form or when they signed up for services such as TiVo. “Has Big Data Made Anonymity Impossible?” Patrick Tucker MIT TECHNOLOGY REVIEW business report: BIG DATA GETS PERSONAL www.technologyreview.com
  40. 40. ‫ה‬ ‫בעידן‬ ‫לפרטיות‬ ‫קורה‬ ‫מה‬-BigData? Much of this data is invisible to people and seems impersonal. But it’s not. What modern data science is finding is that nearly any type of data can be used, much like a fingerprint, to identify the person who created it: your choice of movies on Netflix, the location signals emitted by your cell phone, even your pattern of walking as recorded by a surveillance camera. In effect, the more data there is, the less any of it can be said to be private, since the richness of that data makes pinpointing people “algorithmically possible,” says Princeton University computer scientist Arvind Narayanan
  41. 41. ‫ה‬ ‫בעידן‬ ‫לפרטיות‬ ‫קורה‬ ‫מה‬-BigData?
  42. 42. ‫ה‬ ‫בעידן‬ ‫לפרטיות‬ ‫קורה‬ ‫מה‬-BigData? The greater the amount of personal data that becomes available, the more informative the data gets. In fact, with enough data, it’s even possible to discover information about a person’s future. Last year Adam Sadilek, a University of Rochester researcher, and John Krumm, an engineer at Microsoft’s research lab, showed they could predict a person’s approximate location up to 80 weeks into the future, at an accuracy of above 80 percent. To get there, the pair mined what they described as a “massive data set” collecting 32,000 days of GPS readings taken from 307 people and 396 vehicles. Then they imagined the commercial applications, like ads that say “Need a haircut? In four days, you will be within 100 meters of a salon that will have a $5 special at that time.” Sadilek and Krumm called their system “Far Out.” That’s a pretty good description of where personal data is taking us.
  43. 43. ‫משטר‬‫ה‬‫נבואית‬Predictive Policing
  44. 44. ‫מונעת‬ ‫ענישה‬/ALGO CRMINOLOGY Minority Report ‫הנבואות‬ ‫על‬ ‫להענש‬ ‫עלולים‬ ‫אנחנו‬‫שלנו‬ ‫אלגו‬ ‫יש‬'‫לעשות‬ ‫ידעו‬ ‫והם‬ ‫לעשות‬ ‫עומדים‬ ‫אנחנו‬ ‫מה‬ ‫להגיד‬ ‫שיודעים‬ ‫דקות‬ ‫של‬ ‫בסיס‬ ‫על‬ ‫זה‬ ‫את‬
  45. 45. ‫מונעת‬ ‫ענישה‬/ALGO CRMINOLOGY Kenneth Cukier ‫קנת‬ ‫לפי‬'‫קוקייר‬ ‫ה‬ ‫בעידן‬-small data‫פרטיות‬ ‫היה‬ ‫המרכזי‬ ‫האתגר‬ ‫ה‬ ‫בעידן‬-big data‫האתגר‬‫רצון‬ ‫על‬ ‫לשמור‬ ‫יהיה‬‫חופשי‬, agency(‫עצמאית‬ ‫בפעולה‬ ‫לבחור‬ ‫החופש‬)
  46. 46. ‫משתנה‬ ‫העבודה‬ ‫שוק‬
  47. 47. ‫משתנה‬ ‫העבודה‬ ‫שוק‬ ‫אלגוריתמים‬ ‫האם‬‫לנו‬ ‫לגנוב‬ ‫הולכים‬ ‫דאטה‬ ‫וביג‬ ‫העבודות‬ ‫את‬? ‫יתכן‬ ‫מאד‬.... ‫צווארון‬ ‫ידע‬ ‫עובדי‬ ‫של‬ ‫אלו‬ ‫של‬ ‫את‬ ‫בעיקר‬-‫לבן‬ ‫הייצור‬ ‫קו‬ ‫של‬ ‫והאוטומציה‬ ‫שהמכונות‬ ‫כמו‬ ‫ממש‬ ‫במאה‬ ‫הכחול‬ ‫הצווארון‬ ‫עבודת‬ ‫את‬ ‫אתגרו‬‫ה‬-19
  48. 48. ‫משתנה‬ ‫העבודה‬ ‫שוק‬ ‫לחשוב‬ ‫רוצים‬ ‫אנחנו‬‫כמו‬ ‫ממש‬ ‫נוספות‬ ‫עבודות‬ ‫יווצרו‬ ‫קצרה‬ ‫תקופה‬ ‫שאחרי‬ ‫התעשייתית‬ ‫במהפכה‬ ‫בתקופת‬. ‫חזרו‬ ‫לא‬ ‫ומעולם‬ ‫שנמחקו‬ ‫קטגוריות‬ ‫יש‬ ‫אבל‬ ‫היית‬ ‫אם‬ ‫אליך‬ ‫טובה‬ ‫היתה‬ ‫לא‬ ‫התעשייתית‬ ‫המהפכה‬‫סוס‬ ‫וחכמים‬ ‫זהירים‬ ‫להיות‬ ‫צריך‬ ‫ולכן‬‫ה‬ ‫את‬ ‫להתאים‬-big data‫לצרכינו‬ ‫ולהשתמש‬‫מחושבת‬ ‫יותר‬ ‫בצורה‬ ‫בה‬,‫יותר‬‫אנושית‬
  49. 49. Big Data #fail Not all big data applications have been successful; for example, data for Google’s Flu Trends came from people searching Google, not healthcare professionals, and in the manhunt for the Boston Marathon bombers, for which FBI agents collected 13,000 video feeds and still photos and assigned analysts to look for someone acting suspiciously, the bombers were not apprehended from the data. Bad big data advice comes from reusing the data (how do you ensure that recycled data is clean), or global data sharing (the big concern is “garbage in, garbage out”; how do you stop “garbage in”?)
  50. 50. ‫הזדמנויות‬
  51. 51. ‫דאטה‬ ‫לחוקר‬ ‫ממידען‬? Data Scientist: A New Role For Librarians? by Don Hawkins on April 28, 2015 in CIL2015 www.libconf.com/2015/04/28/data-scientist-a-new-role-for-librarians/ Amy Affelt, Director of Database Research Worldwide at Compass Lexicon and author of The Accidental Data Scientist, a newly-published book by Information Today, discussed some characteristics of Big Data and its possibilities for information professionals
  52. 52. ‫דאטה‬ ‫לחוקר‬ ‫ממידען‬?
  53. 53. ‫דאטה‬ ‫לחוקר‬ ‫ממידען‬?
  54. 54. ‫שאלות‬?
  55. 55. ‫הדברים‬ ‫של‬ ‫האינטרנט‬
  56. 56. ‫הדברים‬ ‫של‬ ‫האינטרנט‬
  57. 57. ‫סיסקו‬–‫הכל‬ ‫של‬ ‫האינטרנט‬ ‫של‬ ‫שהגל‬ ‫מאמינים‬ ‫בסיסקו‬IOT‫גדול‬ ‫יהיה‬ ‫האינטרנט‬ ‫של‬ ‫מהגל‬ ‫יותר‬ ‫לפני‬ ‫רק‬ ‫את‬ ‫לכסות‬ ‫החלו‬4‫שנים‬ 50BILLION SMART OBJECTS ADOPTION RATE OF DIGITAL INFRASTRUCTURE5X FASTER THAN ELECTRICITY CISCO IOT-IS MORE THAN JUST THINGS THINGS13% PPL-20% DATA40% PROCESS-27% www.youtube.com/watch?v=Kt5VulFqBm4
  58. 58. ‫סיסקו‬–‫הכל‬ ‫של‬ ‫האינטרנט‬
  59. 59. http://gizmodo.com/jon-stewart-is-totally- confused-about-the-internet-of-t-1627429053 ‫ג‬ ‫את‬ ‫מבלבל‬ ‫הדברים‬ ‫של‬ ‫האינטרנט‬'‫סטוארט‬ ‫ון‬
  60. 60. ‫תודה‬! www.wesimplify.info romi@wesimplify.info

×