מה ההבדל בין נתונים גדולים ל- DBMS?


תשובה 1:

אני חושב שזה לא נכון לחשוב על Big Data ו- DBMS לגבי נושאים שניתן להשוות.

בסיס נתונים הוא ישות מובנית, שמטרתה לאחסן, לאחזר ולנתח סוג מסוים של נתונים, מסודרים היטב לרשומות (ערכות נתונים) ושדות (רכיבי מערכי נתונים). כמו רשימות כתובות, רשימות לקוחות.

לבסיס נתונים יכולים להיות (ובכל היישומים הפרקטיים הלא טריוויאליים יהיו) טבלאות מרובות עם סוגים שונים של רשומות, הקשורות זה בזה על ידי מקשים שהוגדרו מראש.

ביג דאטה להפך, אינו מבנה, אפילו לא מתודולוגיה מוגדרת בבירור. במקורה היא האמירה הטריוויאלית פחות או יותר שכאשר יש לך "מספיק" נתונים, אתה יכול להצהיר בדוחות ותחזיות מדויקות לגבי אנשים, קבוצות, אירועים וכל זה. אם כן, Big Data הוא סוג של ניתוח נתונים.

לשם כך פותחו כלים רבים לניהול כמויות אדירות של נתונים. הידועה ביותר היא מתודולוגיית Map-Reduce, שפותחה על ידי גוגל. מושגים מעניינים אחרים הם למשל. Hadoop.

הבעיה העיקרית באנליטיקס של Big Data היא להוציא משהו מתוך נתונים לכאורה לא מובנים של מקורות רבים ומגוונים (בסיסי נתונים מובנים, קבצי טקסט, נתוני מדיה חברתית, דוחות מזג אוויר, דוחות תנועה, ...). זה מה שמפה- Reduce ו- Hadoop עוסקות כולן.

שלבים ביניים וסופיים בתהליך הם ניתוח נתונים קלאסיים, כגון מתאם, בו מיושמים הכלים הידועים כמו R או SPMS.

יש הרבה אתגרים בתחום ה- IT. בדרך כלל יש לבצע את הניתוח במספר שרתים במקביל, וזו רק דוגמא אחת.


תשובה 2:

גדול פירושו גדול, אבל מה שחלק גדול ממנו לא גדול כל כך לאחרים.

מרבית מערכות ה- RDBMS ברמה הגבוהה ביותר הן שמחות לחלוטין בטיפול בטרט-נתונים; רבים סבירים למדי עם פטיט. רבים מהאנשים שמכרסמים בפתרונות של "נתונים גדולים" עושים זאת עם בעיות נתונים קטנות שבמקרה האופטימי ביותר יגדלו לבעיות נתונים בינוניות. יתכן ומומלץ לזוג צעיר לרכוש אוטובוס שדה תעופה כתחבורה ראשונית שלהם הצופה צרכים צמיחה עתידית.


תשובה 3:

משמעותם של נתונים גדולים היא מערך נתונים שהוא גדול, בין אם בגלל שיש בו הרבה משתנים או הרבה תצפיות או שניהם.

נתונים גדולים לעתים קרובות (אך בשום פנים ואופן לא תמיד) מתייחסים לנתונים שלא נאספים מתוך מחשבה על המטרות האנליטיות.

ביג דאטה היא מילת באזז שמרמזת על כל מה שהאדם המשתמש בה רוצה לרמוז.

DBMS (מערכת ניהול מסד נתונים) היא מערכת תוכנה המאפשרת לאחסן ולאחזר נתונים בצורה יעילה ומסודרת.

חלק ממערכות מסד הנתונים עוקבות אחר רוב הכללים הללו, וחלקן פועלות רק על כללים מסוימים.

DBMS אינו תומך בהפצה, אך SQL תומך.


תשובה 4:

משמעותם של נתונים גדולים היא מערך נתונים שהוא גדול, בין אם בגלל שיש בו הרבה משתנים או הרבה תצפיות או שניהם.

נתונים גדולים לעתים קרובות (אך בשום פנים ואופן לא תמיד) מתייחסים לנתונים שלא נאספים מתוך מחשבה על המטרות האנליטיות.

ביג דאטה היא מילת באזז שמרמזת על כל מה שהאדם המשתמש בה רוצה לרמוז.

DBMS (מערכת ניהול מסד נתונים) היא מערכת תוכנה המאפשרת לאחסן ולאחזר נתונים בצורה יעילה ומסודרת.

חלק ממערכות מסד הנתונים עוקבות אחר רוב הכללים הללו, וחלקן פועלות רק על כללים מסוימים.

DBMS אינו תומך בהפצה, אך SQL תומך.