מה ההבדל בין ביג דאטה לענן?


תשובה 1:

אלה שני נושאים נפרדים שניתן להשתמש בהם יחד. לשניהם יש מעט ערפול בהגדרותיהם, כך שזה יכול להוביל גם לאי ודאות. אז הרשו לי לנסות להגדיר אותן (בעיקרון ואני בטוח שאחרים יראו את ההגדרות האלה מעט אחרת)

מחשוב ענן: תשתיות שניתן לבצע מחדש מחדש בקלות לכל מספר של עומסי עבודה. משאבי מחשוב אלה מאוגדים יחד לענן מחשוב. משתמשים יכולים להגדיר ולהגדיר חלקים מענן המחשוב שיעבדו על המשימה שלהם בעוד עומס העבודה של משתמשים אחרים נמצא גם בענן. ניתן לבצע הגדלות וירידות במשאבי המחשוב עבור כל עומס עבודה במהירות שכן המשאבים העומדים בבסיסם אינם מובחנים.

זה מוביל למספר יתרונות על פני דגמי מחשוב מסורתיים.

  • ניתן לטעון עומסי עבודה חדשים במהירות רבה - ללא מחזורי רכישה, ללא הגדרת HW, פשוט לפרוס ולבצע ביצועים של מחשב ניתן לגוון במהירות - ניתן לשנות משאבים מחושבים למעלה או למטה כדי לעמוד בדרישות הנוכחיות החוסכות בעלויות סטנדרטיזציה גבוהה יותר - מאז מחשוב הענן המשאבים הם של קבוצה מוגבלת של תצורות שכל היישומים צריכים להפעיל עליהם שמפעילים שימוש חוזר בתוכנה בין יישומים ותשתיות כקוד - מכיוון שרוב התצורות בענן ניתנות להקמה או שינוי עם קוד, סביבות מחשוב הופכות לשחזור בקלות וכתוצאה מכך יכולת רבה יותר להרחיב, להעביר מחדש, או לשחזר פתרונות מחשוב

יש גם כמה צדדים מטה שעומדים לענן:

  • לרמה מסוימת משותפים מחשבי ענן - ספקים צריכים להבטיח שיש בידוד חזק בין משתמשים כאשר מחשבי ענן סרק מישהו עדיין צריך "לשלם" עבורם - בדרך כלל זמן סרק כלול בשיעור השימוש בענן (מכיוון שהממוצע מחשב מרכז מרכזי ייעודי מנוצל רק ב -30% ורוב ספקי הענן הגדולים משתמשים יותר מ- 90%, זה ממש לא עניין של מטה).

ישנם גם סוגים של דגמי מחשוב ענן:

  • Public Cloud - חברת צד ג 'המספקת משאבי מחשוב בענן (תחשוב AWS) ענן פרטי - בדרך כלל, מחלקת ה- IT המרכזית בחברה גדולה תקים ענן כדי להשיג ניצול טוב יותר של משאבי מחשוב ענן היברידי - שילוב של משאבי ענן ציבוריים ופרטיים. להשיג את היתרונות של שניהם

ביג דאטה: מידע / נתונים מתואר בדרך כלל כביג דאטה אם הוא גדול מאוד בגודלו ומגיע ממקורות רבים ומגוונים. עם זאת, במקרים רבים פתרונות נתונים נקראים Big Data רק על פי גודל. כך או כך, בדרך כלל מוטל על המיישמים לתאר את הפתרונות שלהם כביג דאטה או לא.

ההגדרה המעשית בדרך כלל קשורה יותר לכלים ולתהליכים המשמשים מאשר לתיאור נתונים. כאשר חברות עוברות מעבודה על עומסי העבודה ההיסטוריים שלהן ומתרחבות להכניס כלים חדשים (Hadoop, מחסני נתונים, סטרימינג אנליטי וכו ') מעבר זה נקרא בדרך כלל "מעבר ל- Big Data". מכיוון שכך ההגדרה משתנה מאוד מחברה לחברה. נתונים רבים יותר ממה שהם רגילים, יחד עם כלים חדשים שמעולם לא השתמשו בהם בעבר, שווים לאירוע מעבר ארגוני שלעתים קרובות לא נקרא מעבר ביג דאטה. מאוד קשוח.

ביג נתונים בענן הציבורי: כפי שכנראה גילית שנושאים אלה לכאורה לא קשורים הולכים יד ביד. זה נובע מהשינוי בכלכלה שמספקים להם בענן והיכולת לנסות במהירות ובזול כלים חדשים שהוגדרו בעננים ציבוריים. כארגון שמתבקש על ידי ההנהלה להפגיש את כל מקורות הנתונים המגוונים בתוך חברה ו"בטל את הנעילה "של הערך שבתוכו, האם אני הולך להוציא מיליוני דולרים על חומרה ותוכנה חדשים כדי לראות איזה ערך קיים או האם אני הולך להשתמש במודל של תשלום בזמן שאתה זמין בענן הציבורי? חברות הענן הציבוריות האלו עולות על הצעות המדף בהן אוכל לקבל גישה לכל הכלים המגוונים ואני יכול להתחיל לעבוד על פתרונות תוך יום. כדי להגדיר זאת במודל המסורתי דורש ממני לחקור את הכלים, לבחור ערכה, להגדיר את החומרה להפעלתה, להגיש את בקשת רכישת ההון, להמתין רבעון, להזמין את הציוד, להתקין ולהגדיר אותו ואז להתחיל ללמוד כיצד "לבטל את הנעילה" של הערך בנתונים. רוב האנשים בוחרים בענן ציבורי.

אז שני המושגים הללו הם די נפרדים אך לרוב הם מופיעים יחד. ככאלה אני יכול לראות לחלוטין איך יכול להיות בלבול מה כל אחד ואיך הם שונים.

אני מקווה שזה עוזר


תשובה 2:

הענן מתייחס רק למקום בו גר או מתרחש משהו, בשרת מרוחק שמתארח במקום אחר.

אמנם ניתוח וביצוע נתונים גדולים מתרחשים בענן, אך הוא אינו מוגבל לענן. לחברות רבות יש מאגרים פנימיים בסדר גודל מגלתי אותם הם נוטים באופן מקומי.

אתה רואה את המונחים ביחד הרבה מכיוון שחברות רבות עוברות לכיוון מערכות מבוססות ענן מסיבות רבות (מהירות, עלות, הגנה על נכסים, יעילות), אך הדברים שאותן חברות עושות אפשר לעשות הכל בשרתים פנימיים, בתנאי שהם מתאימים גדול ומסופק.


תשובה 3:

הם שני דברים שונים.

נתונים גדולים מתייחסים בדרך כלל לאחסון ועיבוד של נפח גדול של נתונים.

ענן (מחשוב) מתייחס לקבוצה של יכולות המספקות תשתית (שרתים ואחסון) כמו גם שירותים (למשל למידת מכונה, פריסות וכו ') הניתנים לספק באמצעות האינטרנט, בדרך כלל באמצעות ממשקי API.

נתונים גדולים נוטים לדרוש מספר רב של תשתיות וכאן מצטלבים שני העולם. מחשוב ענן מקל על הפעלת שרתים (וגם מסתובב אותם) שניתן להשתמש בהם למטרות נתונים גדולים.

בנוסף לתשתיות, ספקי ענן מספקים גם שירותים מנוהלים שבהם הם מספקים ומתחזקים את התשתית עבור נתונים גדולים, כך שלקוחות יכולים פשוט להתמקד במקרי השימוש. לדוגמא: אמזון EMR.