什麼是大資料,大資料的定義是什麼?

2022-10-31 20:17:01 字數 4760 閱讀 5071

1樓:鯨娛文化

大資料指無法在一定時間範圍內用常規軟體工具進行捕捉、管理和處理的資料集合。通過大量的統計瞭解大家的喜好,想要的東西,從而得到他們想要的,比如精準營銷,徵信分析,消費分析等等

2樓:高頓教育

大資料是指無法在一定時間內用常規軟體工具對其內容進行抓取、管理和處理的資料集合。大資料技術是指從各種各樣型別的資料中,快速獲得有價值資訊的能力。

3樓:匿名使用者

"大資料"是一個體量特別大,資料類別特別大的資料集,並且這樣的資料集無法用傳統資料庫工具對其內容進行抓取、管理和處理。 "大資料"首先是指資料體量(volumes)?大,指代大型資料集,一般在10tb?

規模左右,但在實際應用中,很多企業使用者把多個資料集放在一起,已經形成了pb級的資料量;其次是指資料類別(variety)大,資料來自多種資料來源,資料種類和格式日漸豐富,已衝破了以前所限定的結構化資料範疇,囊括了半結構化和非結構化資料。接著是資料處理速度(velocity)快,在資料量非常龐大的情況下,也能夠做到資料的實時處理。最後一個特點是指資料真實性(veracity)高,隨著社交資料、企業內容、交易與應用資料等新資料來源的興趣,傳統資料來源的侷限被打破,企業愈發需要有效的資訊之力以確保其真實性及安全性。

4樓:幾分鐘看喜歡的影視

數字時代,網際網路運營離不開大資料,什麼是大資料?怎麼應用呢?

大資料的定義是什麼?

5樓:中公教育it培訓優就業

大資料首先是一個非常大的資料集,可以達到tb(萬億位元組)甚至zb(十萬億億位元組)。這裡面的資料可能既有結構化的資料,也有半結構化和非結構化的資料,而且來自於不同的資料來源。

結構化的資料是什麼呢?對於接觸過關係型資料庫的小夥伴來說,應該一點都不陌生。對了,就是我們關係型資料庫中的一張表,每行都具有相同的屬性。如下面的一張表:

每行資料都有相同的屬性,這就是結構化的資料。

我們再來看半結構化資料。xml或json格式的資料就是我們所常見的半結構的資料。如,下面所示的xml資料:

(子標籤的次序和個數不一定完全一致)

知道了這三類結構的資料,我們再來看看大資料的資料來源有哪些呢?歸納起來大致有五種資料來源。

一是社交**平臺。如有名氣的facebook、twitter、youtube和instagram等。**是比較受歡迎的大資料**之一,因為它提供了關於消費者偏好和變化趨勢的寶貴依據。

並且因為**是自我傳播的,可以跨越物理和人口障礙,因此它是企業深入瞭解目標受眾、得出模式和結論、增強決策能力的方式。

二是雲平臺。公有的、私有的和第三方的雲平臺。如今,越來越多的企業將資料轉移到雲上,超越了傳統的資料來源。

雲端儲存支援結構化和非結構化資料,併為業務提供實時資訊和隨需應變的依據。雲端計算的主要特性是靈活性和可伸縮性。由於大資料可以通過網路和伺服器在公共或私有云上儲存和獲取,因此雲是一種高效、經濟的資料來源。

三是web資源。公共網路構成了廣泛且易於訪問的大資料,個人和公司都可以從網上或「網際網路」上獲得資料。此外,國內的大型購物**,**、京東、阿里巴巴,更是雲集了海量的使用者資料。

五是來自於資料庫的資料來源。現今的企業都喜歡融合使用傳統和現代資料庫來獲取相關的大資料。這些資料都是企業驅動業務利潤的寶貴資源。

常見的資料庫有ms access、db2、oracle、mysql以及大資料的資料庫hbase、mongodb等。

我們再來總結一下,什麼樣的資料就屬於大資料呢?通常來大資料有4個特點,這就是業內人士常說的4v,volume容量、 variety多樣性、velocity速度和veracity準確性。

6樓:江西新華電腦學院

大資料(big data,mega data)或稱巨量資料,指的是需要新處理模式才能具有更強的決策力、洞察力和流程優化能力的海量、高增長率和多樣化的資訊資產。 在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大資料時代》中大資料指不用隨機分析法(抽樣調查)這樣的捷徑,而採用所有資料進行分析處理。大資料的5v特點:

volume(大量)、velocity(高速)、variety(多樣)、value(價值密度)、veracity(真實性)。

「大資料」是指以多元形式,許多**蒐集而來的龐大資料組,往往具有實時性。在企業對企業銷售的情況下,這些資料可能得自社交網路、電子商務**、顧客來訪紀錄,還有許多其他**。這些資料,並非公司顧客關係管理資料庫的常態資料組。

[13]

從技術上看,大資料[1]與雲端計算的關係就像一枚硬幣的正反面一樣密不可分。大資料必然無法用單臺的計算機進行處理,必須採用分散式計算架構。它的特色在於對海量資料的挖掘,但它必須依託雲端計算的分散式處理、分散式資料庫、雲端儲存和/或虛擬化技術。

(在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大資料時代[4]》中大資料指不用隨機分析法(抽樣調查)這樣的捷徑,而採用所有資料的方法)大資料的4大特點:volume(大量)、velocity(高速)、variety(多樣)、value(價值)。

早在2023年,著名未來學家阿爾文·托夫勒便在《第三次浪潮》一書中,將大資料熱情地讚頌為「第三次浪潮的華彩樂章」。不過,大約從2023年開始,「大資料」才成為網際網路資訊科技行業的流行詞彙。美國網際網路資料中心指出,網際網路上的資料每年將增長50%,每兩年便將翻一番,而目前世界上90%以上的資料是最近幾年才產生的。

此外,資料又並非單純指人們在網際網路上釋出的資訊,全世界的工業裝置、汽車、電錶上有著無數的數碼感測器,隨時測量和傳遞著有關位置、運動、震動、溫度、溼度乃至空氣中化學物質的變化,也產生了海量的資料資訊。[3]

大資料的意義是由人類日益普及的網路行為所伴生的,受到相關部門、企業採集的,蘊含資料生產者真實意圖、喜好的,非傳統結構和意義的資料 。2023年5月10日,阿里巴巴集團董事局主席馬雲在**十週年晚會上,卸任阿里集團ceo的職位,並在晚會上做卸任前的演講,馬雲說,大家還沒搞清pc時代的時候,移動網際網路來了,還沒搞清移動網際網路的時候,大資料時代來了。

藉著大資料時代的熱潮,微軟公司生產了一款資料驅動的軟體,主要是為工程建設節約資源提高效率。在這個過程裡可以為世界節約40%的能源。拋開這個軟體的前景不看,從微軟團隊致力於研究開始,可以看他們的目標不僅是為了節約了能源,更加關注智慧化運營。

通過跟蹤取暖器、空調、風扇以及燈光等積累下來的超大量資料,捕捉如何杜絕能源浪費。「給我提供一些資料,我就能做一些改變。如果給我提供所有資料,我就能拯救世界。

」微軟史密斯這樣說。而智慧建築正是他的團隊專注的事情。

從海量資料中「提純」出有用的資訊,這對網路架構和資料處理能力而言也是巨大的挑戰。在經歷了幾年的批判、質疑、討論、炒作之後,大資料終於迎來了屬於它的時代。2023年3月22日,奧巴馬**宣佈投資2億美元拉動大資料相關產業發展,將「大資料戰略」上升為國家戰略。

奧巴馬**甚至將大資料定義為「未來的新石油」。

大資料時代已經來臨,它將在眾多領域掀起變革的巨浪。但我們要冷靜的看到,大資料的核心在於為客戶挖掘資料中蘊藏的價值,而不是軟硬體的堆砌。因此,針對不同領域的大資料應用模式、商業模式研究將是大資料產業健康發展的關鍵。

我們相信,在國家的統籌規劃與支援下,通過各地方**因地制宜制定大資料產業發展策略,通過國內外it龍頭企業以及眾多創新企業的積極參與,大資料產業未來發展前景十分廣闊。[2]

大資料就是網際網路發展到現今階段的一種表象或特徵而已,沒有必要神話它或對它保持敬畏之心,在以雲端計算為代表的技術創新大幕的襯托下,這些原本很難收集和使用的資料開始容易被利用起來了,通過各行各業的不斷創新,大資料會逐步為人類創造更多的價值。[1]

7樓:ff酒後少女的夢

「大資料」是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的資訊資產。

大資料結構特點:

結構大資料就是網際網路發展到現今階段的一種表象或特徵而已,沒有必要神話它或對它保持敬畏之心,在以雲端計算為代表的技術創新大幕的襯托下,這些原本很難收集和使用的資料開始容易被利用起來了,通過各行各業的不斷創新,大資料會逐步為人類創造更多的價值。

其次,想要系統的認知大資料,必須要全面而細緻的分解它,我著手從三個層面來:

第一層面是理論,理論是認知的必經途徑,也是被廣泛認同和傳播的基線。在這裡從大資料的特徵定義理解行業對大資料的整體描繪和定性;從對大資料價值的**來深入解析大資料的珍貴所在;洞悉大資料的發展趨勢;從大資料隱私這個特別而重要的視角審視人和資料之間的長久博弈。

第二層面是技術,技術是大資料價值體現的手段和前進的基石。在這裡分別從雲端計算、分散式處理技術、儲存技術和感知技術的發展來說明大資料從採集、處理、儲存到形成結果的整個過程。

第三層面是實踐,實踐是大資料的最終價值體現。在這裡分別從網際網路的大資料,**的大資料,企業的大資料和個人的大資料四個方面來描繪大資料已經展現的美好景象及即將實現的藍圖。

特點大資料大資料分析相比於傳統的資料倉儲應用,具有資料量大、查詢分析複雜等特點。《計算機學報》刊登的「架構大資料:挑戰、現狀與展望」一文列舉了大資料分析平臺需要具備的幾個重要特性,對當前的主流實現平臺——並行資料庫、mapreduce及基於兩者的混合架構進行了分析歸納,指出了各自的優勢及不足,同時也對各個方向的研究現狀及作者在大資料分析方面的努力進行了介紹,對未來研究做了展望。

大資料的4個「v」,或者說特點有四個層面:

第一,資料體量巨大。從tb級別,躍升到pb級別。

第三,處理速度快,1秒定律,可從各種型別的資料中快速獲得**值的資訊,這一點也是和傳統的資料探勘技術有著本質的不同。

第四,只要合理利用資料並對其進行正確、準確的分析,將會帶來很高的價值回報。業界將其歸納為4個「v」——volume(資料體量大)、variety(資料型別繁多)、velocity(處理速度快)、value(價值密度低)。

大資料最核心的價值就是在於對於海量資料進行儲存和分析。相比起現有的其他技術而言,大資料的「廉價、迅速、優化」這三方面的綜合成本是最優的。

什麼是大資料,什麼是大資料及大資料技術

大資料指無法在一定時間範圍內用常規軟體工具進行捕捉 管理和處理的資料集合。通過大量的統計瞭解大家的喜好,想要的東西,從而得到他們想要的,比如精準營銷,徵信分析,消費分析等等 大資料是指無法在一定時間內用常規軟體工具對其內容進行抓取 管理和處理的資料集合。大資料技術是指從各種各樣型別的資料中,快速獲得...

什麼叫做大資料,大資料是什麼,什麼叫大資料?

大資料是指無法在一定時間內用常規軟體工具對其內容進行抓取 管理和處理的資料集合。大資料技術是指從各種各樣型別的資料中,快速獲得有價值資訊的能力。大資料指無法在一定時間範圍內用常規軟體工具進行捕捉 管理和處理的資料集合。通過大量的統計瞭解大家的喜好,想要的東西,從而得到他們想要的,比如精準營銷,徵信分...

大資料是什麼,大資料是什麼含義

大資料指無法在一定時間範圍內用常規軟體工具進行捕捉 管理和處理的資料集合。通過大量的統計瞭解大家的喜好,想要的東西,從而得到他們想要的,比如精準營銷,徵信分析,消費分析等等 大資料是指無法在一定時間內用常規軟體工具對其內容進行抓取 管理和處理的資料集合。大資料技術是指從各種各樣型別的資料中,快速獲得...