בינה עסקית (באנגלית: Business intelligence, בראשי תיבות: BI) היא תחום בטכנולוגיית המידע העוסק בבניית מערכות העוזרות לארגון להפיק מידע משמעותי מבחינה עסקית מתוך מכלול הנתונים הנאספים על ידיו. מערכות הבינה העסקית מספקות מידע היסטורי, מידע עכשווי ותחזיות בנוגע לפעילות העסקית, ובעזרתן ניתן לאתר דפוסים משמעותיים לניהול של ארגון, וליצור דוחות התראות ואיתותים לצורך קבלת החלטות ניהוליות. טכנולוגיות בינה עסקית כוללות כריית מידע (Data mining), עיבוד אנליטי מקוון (Online analytical processing, OLAP), ניהול ביצועים עסקיים (Business performance management), מידוד (Benchmarking) וניתוח מנבא (Predictive analytics).
הצורך ב-BI נגרם מהגידול העצום בכמות הנתונים הנאספים בארגון (אלו מכונים לעתים “Big Data”), אשר מקשים על ניתוחם הידני, ללא כלים לאישוש והבטחת אמינות של המסקנות. BI כולל שיטות מגוונות למחקר נתונים. חלק מהשיטות מתייחסות גם לתפעול הנתונים והכשרתם לצורכי ניתוח והפקת מסקנות. אחת השיטות המרכזיות בבינה עסקית, והבסיס של BI לשימושי מידע ארגוני, היא כריית מידע.
היסטוריה
מערכות תומכות החלטה (Decision Support Systems, DSS) הפכו למעשיות בסוף שנות ה-60 של המאה ה-20, עם הופעת המיני מחשבים. מערכות אלה עשו שימוש במידע על מנת לתמוך בהחלטות עסקיות. המערכות הראשונות היו מבוססות על מודלים (Model Driven DSS) של סימולציה עם כמויות נתונים מזעריות. מוצר התוכנה הראשון שפעל לפי מודל זה היה IFPS. בשלב מאוחר יותר התפתחו מערכות שהן מבוססות נתונים (DSS Driven Systems). במחצית הראשונה של שנות ה-80 התפתחו מערכות תומכות החלטה בנושאים נוספים כמו תכנון פיננסי, גיליונות אלקטרונייםובמחצית השנייה של שנות ה-80 ובתחילת שנות ה-90 התווספו בינה עסקית, מחסן נתונים, Executive Information Systems ומערכות OLAP[1].
בסוף שנות ה-80 ובתחילת שנות ה-90 החל שימוש במושג Business Intelligence. האיש שהביא את המושג לשימוש נרחב היה האוורד דרזנר (Howard Dresner), אנליסט בחברת גרטנר(Gartner).
החל מאמצע שנות ה-2000 קיימים כלים חדשים לבינה עסקית בתפיסה הנקראת Business Intelligence 2.0 (BI 2.0), המאפשרים ביצוע שאילתות על ידי עובדים על נתוני הארגון בזמן אמיתי. המושג BI 2.0 נטבע בהקבלה למושג Web 2.0 משום שעיבודים מסוג זה הם בתפיסה של דפדפן בסביבת Web. כלי BI 2.0 מאפשרים דיווחים דינמיים יותר מהדיווחים הסטטיים שאפיינו כלים מדור קודם. בסיס חשוב לעיבודים מסוג זה הוא השימוש ב-SOA, שבא ביחד עם שימוש במוצרי תָוְוכָה (Middleware) גמישים יותר ושימוש בתקנים להעברת מידע.
בשנים האחרונות תפס הנושא של בינה עסקית מקום מרכזי במערכות המידע. הגידול הרב במידע הנצבר במערכות ממוחשבות מחייב הצגה וריכוז של נתונים רלוונטיים על מנת שלמידע תהיה משמעות. אחד הביטויים לחשיבות התחום הוא רכישת חברות בולטות המתמחות בתחום על ידי חברות תוכנה גדולות (ראו בפרק מוצרי BI). מגמות נוספות בשנים האחרונות:
שימוש ב-SaaS עבור יישומי בינה עסקית
שימוש בבינה עסקית תפעולית (ראו בפרק בינה עסקית תפעולית).
בניה עצמאית של יישומי בינה עסקית על ידי משתמשים שאינם מומחי מחשוב.
תהליך העבודה
תהליך עבודה אופייני בבינה עסקית כולל את השלבים הבאים:
הגדרה וזיהוי של המידע לשימוש במסגרת התהליך – בשלב זה ממופים ומזוהים הנתונים שיהוו קלט לדיווח ולניתוח ומקורותיהם. המקורות עשויים להיות מקורות פנימיים מובְנים (למשל: בסיסי נתונים), מקורות פנימיים לא מובְנים, כגון: הודעות דואר אלקטרוני ומקורות חיצוניים, למשל: דפי אינטרנט, דפי ויקי ובלוגים.
בניית מאגר הנתונים – הנתונים הרלוונטיים מועברים מקבצי ובסיסי הנתונים שבהם הם נמצאים ומרוכזים במאגר ייעודי.
ניתוח הנתונים – עיבודים המנסים לזהות בנתונים דפוסים משמעותיים מבחינה עסקית
הגדרת תפוצת הדיווח בשני מישורים: מי הם בעלי התפקידים הצריכים לקבל את הדיווח? לאיזה תצוגה, הדפסה או מדיה מגנטי ישלח הדו”ח לכל מקבל?
דיווח – בשלב זה מדווחות תוצאות הניתוחים שבוצעו.
נושא חשוב בהקשר זה הוא מי הגורם המפעיל את הניתוחים והדיווחים. בחלק מהמקרים מתבצעת העבודה על ידי תוכניתנים. מודל עדיף הוא זה שבו הכלי מאפשר למשתמשים עסקיים לבצע חלק מהשלבים או את כולם. היתרונות במקרה זה הם:
המשתמש העסקי (למשל: מנתח פיננסי, מנהל שיווק) מבין טוב יותר את ההקשר העסקי ולכן עשוי לבצע ניתוחים ודיווחים מתאימים יותר
נחסך זמן של הגדרת ותיאום הדרישות ממומחי המחשוב ובחינת התאמת תוצריהם לדרישות.
קבוצת משתמשים שבמקרים רבים מבצעת עיבודים כאלה הם Power Users. כך למשל: כלכלנים בבנק עשויים להיות Power Users. משתמשים כאלה הם משתמשים בעלי יכולות גבוהות יחסית בתחום המחשוב ולכן מצליחים ללמוד צדדים טכניים של מוצר ה-BI ולבצע בעצמם ניתוחים ודיווחים.
מחסן נתונים ו-BI
ערך מורחב – מחסן נתונים
סכמת כוכב – סכמה נפוצה במחסני נתונים
סכימת פתיתי שלג – סכמה נפוצה במחסני נתונים
מחסן נתונים הוא בדרך כלל בסיס נתונים המשמש מערכות תומכות החלטה ובכלל זה מערכות BI. בסיס נתונים זה הוא בדרך כלל בסיס נתונים גדול יחסית הניזון מנתונים תפעוליים ממספר גדול של מקורות שונים. הנתונים מועברים לבסיס הנתונים באמצעות תהליך ETL (Extract, Transform, Load). בשלב הראשון (Extract) מועתקים הנתונים מהמקורות לבסיס נתונים ביניים (Staging). בשלב השני (Transform) עוברים הנתונים שינויים, כגון: סיכום נתונים פרטניים לנתון אחד חשוב מבחינה עסקית. כך, למשל נתון על מכירה בודדת של מוצר עשוי להיות לא מעניין לצורך קבלת החלטות עסקיות ולכן הוא מסוכם לנתון כולל של כל המכירות באזור גאוגרפי מסוים. בשלב השלישי נטענים הנתונים למחסן הנתונים.
בגלל כמויות הנתונים הגדולות בדרך כלל מבוצע התהליך המתואר לעיל בעיבוד באצווה (Batch processing). במקרים רבים עיבודי הבינה העסקית המתבצעים מול מחסן נתונים הם עיבודים שתוצאותיהם חשובות לדרגי הניהול הגבוהים, משום שהם מתייחסים לחלק גדול מהפעילות העסקית בארגון. כמו כן במקרים רבים אין מדובר בדיווחים פשוטים, אלא בתוצאות של ניתוחים מורכבים המבוססים על כריית מידע. קלט תחליפי למחסן נתונים הוא Data Mart (או מרכול נתונים), שדומה בתכונותיו למחסן הנתונים למעט היקף וגודל: הוא מעין מחסן נתונים חלקי המתייחס לחלק ממערכות הארגון או למערכת יחידה.
עיבוד אנליטי מקוון (OLAP)
ערך מורחב – עיבוד אנליטי מקוון
מערכות תפעוליות, כדוגמת מערכות המשמשות מוקד שירות (Call Center) או מערכת לתכנון משאבי ארגון (ERP) מתבססות על מסדי נתונים המיועדים לעיבוד תנועות מקוון (Online Transaction Process), ומכוונים לביצוע מהיר של טרנזקציות ולזמני תגובה מהירים. מסיבה זו במסדי הנתונים המיועדים למערכות אלו המידע לא מוחזק בדרך כלל לתקופת זמן ארוכה,[2] והמידע המוחזק משתנה תכופות. בעיבוד אנליטי מקוון המידע עשוי להיות מאוחסן במודל נתונים רב-ממדי, באופן המאפשר לענות על שאלות אנליטיות רב-ממדיות במהירות. מודל נתונים זה נעזר בין היתר בשיטות של בסיסי נתונים היררכיים. העיבוד האנליטי המקוון נמצא בשימוש בין היתר בדיווחים עסקיים על מכירות, בשיווק, בניהול תהליכים עסקיים, בתקצוב, בחיזוי, בדיווחים פיננסים ועוד.
אילוסטרציה של קוביית OLAP המייצגת מידע רב ממדי
מושג מרכזי בליבה של מערכת OLAP הוא קוביית OLAP (OLAP cube). קוביית OLAP מורכבת מנתונים מספריים הנקראים מדידות אשר משתייכים לממדים. קוביית OLAP נבנית לרוב על פי סכמת כוכב (Star schema) או סכימת פתיתי שלג (Snowflake schema). המדידות נגזרות מהרשומות בטבלת העוּבדות ואילו הממדים נגזרים מטבלאות הממדים. דוגמה לקוביית OLAP עשויה להיות כזו המאחסנת מכירות כמדידות, ותאריך/זמן כממד. לכל מכירה יש ממד זמן המספק פרטים נוספים על המכירה. ניתן להוסיף ממד נוסף לקוביית ה-OLAP באמצעות הוספת שדה נוסף לטבלת העובדות.
השיטה הנפוצה לתשאול מסדי נתונים רב-ממדיים היא באמצעות MDX.
כריית מידע
ערך מורחב – כריית מידע
באמצעות שימוש בכריית מידע יכול הארגון לגלות מידע חבוי הטמון במחסני הנתונים או ב-Data marts, ולהסיק מסקנות מהצלבתו. כריית המידע מאפשרת לגלות ידע בבסיסי הנתונים, באמצעות מחקר וניתוח של הכמות הגדולה של המידע באמצעים אוטומטיים ככל שניתן, וכך לגלות דפוסים תקפים חדשים, שימושיים ובעלי משמעות.
הבעיות הנפוצות המטופלות בכריית מידע הן בעיות סיווג, ניתוח אשכולות, רגרסיה ולמידת חוקי אסוציאציה.
בבעיות סיווג בונים באמצעות כריית המידע מודל סיווג בהתאם לדוגמאות שנאספו בעבר, ובאמצעותו מסווגים מקרים חדשים. בנק, למשל, יכול לבנות מודל סיווג של לווי משכנתא בהתאם לדוגמאות שנאספו בעבר. כאשר מגיע לקוח חדש המבקש משכנתא הוא מסווג לפי מידת הוודאות שהוא אכן יצליח לעמוד בעתיד בהחזרי ההלוואה.
בעיות של ניתוח אשכולות דומות לבעיות סיווג, אך הקבוצות שאליהן הפריטים יסווגו אינן מוגדרות מראש. האלגוריתם מחלק את הרשומות לאשכולות, כך שבכל אשכול נמצאות רשומות בעלות מאפיינים דומים. למשל ניתן להיעזר באלגוריתם לניתוח אשכולות כדי לפלח את לקוחות החברה.
בבעיות רגרסיה מאפשרת כריית נתונים מציאת פונקציה אשר מנבאת את המודל של הנתונים. דוגמאות לבעיות כאלו בתחום הבינה העסקית הן למשל חיזוי מכירות, ניבוי הצלחה בלימודים אקדמיים על פי בחינות בגרות ומבחנים פסיכומטריים או מידת ההשפעה של הפרסום על קניית המוצרים.
למידת חוקי אסוציאציה נועדה למצוא קשרים מעניינים בין פריטים שונים של נתונים. הדוגמה הנפוצה ביותר היא ניתוח סל קניות. במקרה זה מנסים למצוא האם יש חוקיות בין מוצרים שונים שנרכשו על ידי אותו לקוח באותה קנייה. למשל ניתן לדעת אילו מוצרים נרכשים בדרך כלל יחדיו (בירה וחיתולים[3]). בהתאם לתוצאות ניתן לסדר את המוצרים במרכול בצורה האופטימלית.
בינה עסקית תפעולית] יצירת בסיסי נתונים שמהווים קלט לדיווחים וניתוחים של בינה עסקית עשויה להיות תהליך שאורך זמן רב. בגלל הצורך העסקי להגיב בזמן קצר לאירועים תפעוליים נדרש דווח או ניתוח מיידי או מהיר. צורך זה הגדיר תחום חדש ומתפתח במהירות של בינה עסקית תפעולית [4]
בבינה עסקית תפעולית מופקים הניתוחים והדו”חות ישירות מנתוני המערכות התפעוליות של עיבוד תנועות מקוון, ללא תהליכים של יצירת בסיס נתונים ייעודי למערכות הבינה העסקית. במקרים רבים הבינה העסקית מייחסת אירוע שהתרחש במהלך עיבוד תנועה מקוונת ליעדים עסקיים טקטיים של הארגון. במקרים רבים תצוגת הדיווחים תהיה מקוונת, על מנת לאפשר תגובה בזמן קצר. דוגמה לדווח בינה עסקית תפעולית הוא הנושא של זיהוי רמייה (Fraud Detection). בזמן ביצוע עיבוד תנועה מקוונת, מנתחת מערכת בינה עסקית העוסקת בזיהוי רמייה את מאפייני ונתוני הטרנזקציה, וכאשר מזוהה רמייה מדווחים הנתונים מידית.
בינה עסקית תפעולית קשורה לאירועים המתרחשים במערכת הממוחשבת, לפיכך קיים קשר הדוק בינה לבין ארכיטקטורה מוכוונת אירועים (Event Driven Architecture בראשי תיבות EDA) הנקראת גם SOA 2.0.
שימושים עיקריים
תחום הבינה העסקית, בדומה לתחומים כמו BPM או SOA, הוא תחום שתכליתו התאמה (Allignment) בין הארגון או העסק לבין מערכות המידע. אחד ההיבטים של התאמה כזו הוא היכולת של המשתמש העסקי לבצע באופן עצמאי פעולות הקשורות לעסק במערכות מחשוב, ללא הצורך בתיווך של מומחה מחשוב.
הצורך של ארגונים להגיע להתאמה כזו, גורם לכך שנעשה שימוש הולך וגובר ב-BI. השימוש הנפוץ ביותר הוא לדיווחים בעלי משמעויות עסקיות. שימוש נוסף הוא לדיווחים לצרכים מחקר או ניתוח.
ניתן לסווג את הדיווחים לסוגים על פי מאפיינים:
טווח הדיווח – הדיווח עשוי להיות ברמה אישית, מחלקתית או ברמת הארגון כולו. כמו כן הבינה העסקית עשויה להיות תומכת החלטה או תפעולית (כלומר: נושאים הקשורים במערכות תפעוליות נתונים ממערכות אלה).
סוג הדיווח:דיווח קבוע – דיווח שהוגדרו מראש מאפייניו, תדירויות הפקתו (למשל: אחת לחודש) והגורמים אליהם ישלח.
דיווח אד-הוק – דיווח בהתאם לצרכים ולדרישות נקודתיים. היוזם והמבצע עשוי להיות משתמש עסקי.
מהות הדיווח – דיווח של נתונים גולמיים שעברו מניפולציות או דווח לאחר ניתוח של דפוסים מורכבים המבוססים על כריית מידע או על OLAP.
תצוגת הדיווח -דיווח גרפי או תווי. דיווח הנשלח לקובץ, מדפסת או מסך. הדיווח הגרפי עשוי להיות מבוסס על תרשימים (Charts) ותמונות.