亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

數(shù)據(jù)分析將成為創(chuàng)新起源與企業(yè)核心能力

程序人生 ? 來源:程序人生 ? 作者:程序人生 ? 2022-04-28 10:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

據(jù) Gartner 2022 年最新趨勢分析,數(shù)據(jù)分析將成為創(chuàng)新起源與企業(yè)核心能力,數(shù)據(jù)越來越重要了。在更早前 IDC 和數(shù)據(jù)存儲公司希捷的報告表示,我國產(chǎn)生的數(shù)據(jù)量從 2019 年的約 9.4ZB 將猛增至 2025 年的 48.6ZB?,F(xiàn)在,數(shù)據(jù)工程師需要面對愈加繁雜和龐大的數(shù)據(jù)、離線場景/實時場景/流式場景等眾多不同的分析場景、多個數(shù)據(jù)庫技術棧并存和與之對應的存儲計算成本,很多公司的數(shù)據(jù)團隊往往會被這些海量數(shù)據(jù)與各類底層集群、基礎設施的要求所淹沒。

如何降本增效,打通數(shù)據(jù)分析與存儲,提高數(shù)據(jù)分析的靈活性,同時降低底層資源的運維成本,成為了令技術團隊頭疼的問題。

智能湖倉,數(shù)據(jù)分析的下一站已到來

這個時代,駕馭數(shù)據(jù)的能力是所有決策者“技能清單”里最重要的一項。歷史告訴我們,無論哪個行業(yè),率先在行業(yè)中掌握新工具“利器”是多么重要。

最早的傳統(tǒng)型、老式的純數(shù)據(jù)倉庫已經(jīng)不適宜半 / 非結構化數(shù)據(jù)的處理;而單純的數(shù)據(jù)湖雖然適合存儲數(shù)據(jù),但不支持事務處理,不保證數(shù)據(jù)質(zhì)量,并且缺乏一致性與隔離性。

站在數(shù)據(jù)價值出口的角度來看,只有各類數(shù)據(jù)價值平臺全面落地應用,大數(shù)據(jù)的潛能才會被進一步釋放。為了實現(xiàn)數(shù)據(jù)湖和數(shù)據(jù)倉庫之間的無縫流轉,打通數(shù)據(jù)存儲和計算的不同的層面,兼顧數(shù)據(jù)湖的靈活性和數(shù)據(jù)倉庫的成長性,促進企業(yè)更有效的工具應用,像亞馬遜云科技就提出了“智能湖倉”架構,幫助企業(yè)客戶加快大數(shù)據(jù)價值實現(xiàn)進程。

以創(chuàng)新技術廠商亞馬遜云科技為例,2020 年在亞馬遜云科技 re:Invent 大會上,亞馬遜云科技針對數(shù)據(jù)分析等相關服務推出了“智能湖倉”架構,不過早在 2017 年,亞馬遜就發(fā)布了 Amazon Redshift Spectrum,該功能使得 Amazon Redshift 在當時就具備了打通數(shù)據(jù)湖和數(shù)據(jù)倉庫的能力,實現(xiàn)跨數(shù)據(jù)湖、數(shù)據(jù)倉庫的數(shù)據(jù)查詢。此外,在 2021 年 re:Invent 大會上,亞馬遜云科技更進一步,在存算分離架構基礎上,推出更多數(shù)據(jù)分析服務的無服務器(Severless)版。

b3bafcc4-c689-11ec-bce3-dac502259ad0.png

現(xiàn)在,無服務器架構(以 2014 年推出的 Amazon Lambda 為代表)已經(jīng)是云原生中最熱門的技術類別。無服務器應用程序是由事件驅(qū)動的,并通過與技術無關的 API 或消息收發(fā)進行松散耦合,可以讓開發(fā)者更關注于構建產(chǎn)品中的應用,而不需要管理和維護底層堆?!,F(xiàn)在,數(shù)據(jù)分析服務借助無服務器的能力,可以讓用戶更便捷地構建數(shù)據(jù)存儲、分析、智能應用解決方案,徹底實現(xiàn)無服務器的數(shù)據(jù)分析服務,完成底層龐雜數(shù)據(jù)的高效處理、流轉與共享。

能夠達到這樣的技術水平和高度,離不開時間的沉淀和技術的積累。想要深刻理解“智能湖倉”,就需要了解它的過去與現(xiàn)在。我們能看到,亞馬遜云科技所推出的無服務器數(shù)據(jù)分析服務,經(jīng)歷了幾個階段:

b3cc64aa-c689-11ec-bce3-dac502259ad0.png

(1)2006 年,亞馬遜云科技正式推出 Amazon S3,其作為亞馬遜第一個云產(chǎn)品,提供了多種經(jīng)濟高效的存儲類和易于使用的管理功能,從而滿足特定的業(yè)務、組織和合規(guī)性要求。如今“智能湖倉”就是基于 Amazon S3 構建數(shù)據(jù)湖,繞湖集成數(shù)據(jù)倉庫、大數(shù)據(jù)處理、日志分析、機器學習等數(shù)據(jù)服務。Amazon S3 數(shù)據(jù)湖的可靠性和大容量的數(shù)據(jù)存儲能力,是確保整個“智能湖倉”架構有效應用的基礎。對于軟件開發(fā)人員來說,現(xiàn)在已經(jīng)是無服務器架構的 Amazon S3 可以很低的成本提供可擴展、可靠且延遲低的數(shù)據(jù)存儲基礎設施,讓開發(fā)人員利用云計算的規(guī)模優(yōu)勢,以極低的前期資源投入換取穩(wěn)定的數(shù)據(jù)基礎設施,非常適合進行快速技術創(chuàng)新。

b3eefb32-c689-11ec-bce3-dac502259ad0.jpg

(2)Amazon Athena 是一種無服務器的交互式查詢服務,用戶能夠輕松使用標準 SQL 分析 Amazon S3 中的數(shù)據(jù)。無需 ETL ,具備 SQL 技能的任何人都可以輕松快速地分析數(shù)據(jù)湖中的大規(guī)模數(shù)據(jù)集,這對技術人員的生產(chǎn)力是一種解放!當我們想使用 SQL 直接進行數(shù)據(jù)湖上的分析且不想管理任何集群時,Athena 無疑是一個敏捷且快速開始的選擇。

(3)Amazon Redshift 使用 SQL 在數(shù)據(jù)倉庫、運營數(shù)據(jù)庫和數(shù)據(jù)湖間分析結構化和半結構化數(shù)據(jù),專注于在急速獲取洞察,并交付業(yè)務結果,無需考慮管理數(shù)據(jù)倉庫等基礎設施。而現(xiàn)如今,無服務器版的 Amazon Redshift Serverless 使得數(shù)據(jù)倉庫更加敏捷,用戶無需親自設置和管理數(shù)據(jù)倉庫基礎設施,即可在幾秒鐘內(nèi)輕松運行和擴展分析,實現(xiàn) PB 級數(shù)據(jù)規(guī)模的數(shù)據(jù)分析。目前來說,已經(jīng)有很多企業(yè)去選擇 Amazon Redshift 來縮短他們獲得洞察的時間,因為它易于使用,可在任何規(guī)模提供可靠的性能分析所有數(shù)據(jù),也可能是因為 Amazon Redshift 提供比其他云數(shù)據(jù)倉庫高 3 倍的性價比。Amazon Redshift Serverless 是非常適合難以預測計算需求的情況,例如可變工作負載、具有空閑時間的周期性工作負載以及具有峰值的穩(wěn)態(tài)工作負載。這種方法也非常適合需要快速入門的臨時分析需求以及測試和開發(fā)環(huán)境。

b4031aae-c689-11ec-bce3-dac502259ad0.jpg

(4)Amazon EMR 也推出了 Serverless 無服務器的版本。開發(fā)者可以使用無服務器的方式運行使用開源大數(shù)據(jù)框架(如 Apache Spark、Hive 和 Presto)構建的程序,在云中運行 PB 級數(shù)據(jù)分析,而無需配置、管理、優(yōu)化或保護集群。用戶無需猜測集群大小,Amazon EMR Serverless 具備自動細粒度擴縮,并且提供性能優(yōu)化的運行時,速度是開源版本的兩倍以上。另外,Amazon EMR 在安裝 Spark、Hive、Presto 或 Trino 時可以默認安裝 Hudi 組件,以實現(xiàn)開放格式(如 Apache Parquet 和 Apache Avro)維護 Amazon S3 或 HDFS 中的數(shù)據(jù)。舉個例子,使用 Amazon EMR,技術人員可以將 Parquet 數(shù)據(jù)集轉化為 Hudi 數(shù)據(jù)集,而無需重寫數(shù)據(jù)集,快速將現(xiàn)有數(shù)據(jù)集遷移至 Apache Hudi 數(shù)據(jù)集,例如 Amazon S3 上 1TB 的 Parquet 數(shù)據(jù)集,引導執(zhí)行的速度已經(jīng)比批量插入快了五倍!

通過了解,CSDN 看到,上述這些僅僅只是亞馬遜云科技中的一小部分數(shù)據(jù)服務及其無服務器版的發(fā)展變化。發(fā)布既是無服務器架構的云原生 NoSQL—Amazon DynamoDB,兩年前即實現(xiàn)無服務器化的云原生關系型數(shù)據(jù)庫Amazon Aurora Serverless v1(本周第二代v2也已上線),也都是值得挖掘的技術創(chuàng)新。

正是隨著這些服務的升級與發(fā)展,“智能湖倉”也在向更敏捷,更智能的方向演變。也讓技術界看到,數(shù)據(jù)分析的下一站已到來。

全棧式云原生數(shù)據(jù)分析服務,讓數(shù)據(jù)真正“敏捷分析”

我們能看到,“智能湖倉”更強調(diào)架構,強調(diào)數(shù)據(jù)的自由流動和集中統(tǒng)一治理?!爸悄芎}”架構不是簡單地將湖與倉打通,而是將湖、倉與專門構建等數(shù)據(jù)服務連接成為一個整體,讓數(shù)據(jù)在其間移動和訪問,進一步實現(xiàn)數(shù)據(jù)在數(shù)據(jù)湖、數(shù)據(jù)倉庫,以及在數(shù)據(jù)查詢、數(shù)據(jù)分析、機器學習等各類專門構建等服務之間按需移動,從而形成統(tǒng)一且連續(xù)等整體,滿足客戶等各種需求。

亞馬遜云科技的“智能湖倉”架構具有靈活擴展、專門構建、數(shù)據(jù)融合、敏捷分析、開源開放等特點。詳細來說,背靠 Amazon S3 數(shù)據(jù)湖存儲的高可靠和大容量,對于數(shù)據(jù)存儲資源彈性伸縮擴展,在此之上,技術人員通過使用亞馬遜云科技經(jīng)驗總結的具象產(chǎn)品實力,如交互式查詢服務 Amazon Athena、云上大數(shù)據(jù)平臺 Amazon EMR、云數(shù)據(jù)倉庫 Amazon Redshift 等專門構建的數(shù)據(jù)分析服務,以及數(shù)據(jù)融合統(tǒng)一治理的架構之下,企業(yè)可以無需機器學習經(jīng)驗,使用 SQL 語句,甚至不編寫代碼,去進行數(shù)據(jù)分析。這種模式可以大大降低數(shù)據(jù)人員的技術門檻,讓更多數(shù)據(jù)業(yè)務人員去擁抱數(shù)據(jù),實現(xiàn)敏捷、快速、低成本的數(shù)據(jù)分析。

在“智能湖倉”架構下,云原生數(shù)據(jù)分析服務可以全面覆蓋流數(shù)據(jù)分析、數(shù)據(jù)湖、Hadoop 等常用的分析場景,所有均無服務器化。無服務器的分析工具讓客戶無需配置、擴展或管理集群或服務器,也不必擔心容量配置,從而可以最大程度地為客戶減少無差別的繁瑣工作,讓數(shù)據(jù)真正實現(xiàn)全棧、敏捷地分析。

面對海量數(shù)據(jù)與細分環(huán)境,亞馬遜云科技無服務器的“智能湖倉”架構則將易用、易擴展、高性能、專門構建、安全及智能等特性融于一體,打通數(shù)據(jù)湖和數(shù)據(jù)倉庫,進一步將各種服務無縫集成,確保數(shù)據(jù)在不同服務之間順暢流動,進而幫助客戶盡可能最大程度地提高數(shù)據(jù)價值,加速創(chuàng)新,并成為數(shù)據(jù)驅(qū)動型組織。

從亞馬遜的技術布局和發(fā)展路徑,我們能看到,全棧、云原生的數(shù)據(jù)分析時代已經(jīng)到來,智能化的湖倉將成為新一代數(shù)據(jù)平臺架構。而借助智能湖倉,與數(shù)據(jù)相關的技術與業(yè)務人員,將可以擺脫對底層架構與數(shù)據(jù)處理技術的多個掣肘,專注于挖掘數(shù)據(jù)的創(chuàng)新性分析與應用,以發(fā)現(xiàn)并抓住任何一個創(chuàng)新的機遇。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標題:全棧、云原生的數(shù)據(jù)分析時代已來,我們?nèi)绾巫プC會?

文章出處:【微信號:coder_life,微信公眾號:程序人生】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    Exensio 應用篇:賦能IDM企業(yè)的全能型數(shù)據(jù)分析中樞

    在當今半導體行業(yè),企業(yè)面臨著海量數(shù)據(jù)的挑戰(zhàn)與機遇,如何高效整合與分析這些數(shù)據(jù),成為企業(yè)提升競爭力
    的頭像 發(fā)表于 08-19 13:48 ?593次閱讀
    Exensio 應用篇:賦能IDM<b class='flag-5'>企業(yè)</b>的全能型<b class='flag-5'>數(shù)據(jù)分析</b>中樞

    如何通過數(shù)據(jù)分析識別設備故障模式?

    通過數(shù)據(jù)分析識別設備故障模式,本質(zhì)是從聲振溫等多維數(shù)據(jù)中提取故障特征,建立 “數(shù)據(jù)特征 - 故障類型” 的映射關系,核心可通過特征提取、模式匹配、趨勢
    的頭像 發(fā)表于 08-19 11:14 ?449次閱讀
    如何通過<b class='flag-5'>數(shù)據(jù)分析</b>識別設備故障模式?

    構建自定義電商數(shù)據(jù)分析API

    ? 在電商業(yè)務中,數(shù)據(jù)是驅(qū)動決策的核心。隨著數(shù)據(jù)量的增長,企業(yè)需要實時、靈活的分析工具來監(jiān)控銷售、用戶行為和庫存等指標。一個自定義電商
    的頭像 發(fā)表于 07-17 14:44 ?324次閱讀
    構建自定義電商<b class='flag-5'>數(shù)據(jù)分析</b>API

    AI數(shù)據(jù)分析儀設計原理圖:RapidIO信號接入 平板AI數(shù)據(jù)分析

    AI數(shù)據(jù)分析儀, 平板數(shù)據(jù)分析儀, 數(shù)據(jù)分析儀, AI邊緣計算, 高帶寬數(shù)據(jù)輸入
    的頭像 發(fā)表于 07-17 09:20 ?415次閱讀
    AI<b class='flag-5'>數(shù)據(jù)分析</b>儀設計原理圖:RapidIO信號接入 平板AI<b class='flag-5'>數(shù)據(jù)分析</b>儀

    TDengine 發(fā)布時序數(shù)據(jù)分析 AI 智能體 TDgpt,核心代碼開源

    2025 年 3 月 26 日,濤思數(shù)據(jù)通過線上直播形式正式發(fā)布了其新一代時序數(shù)據(jù)分析 AI 智能體——TDgpt,并同步開源其核心代碼。這一創(chuàng)新功能作為 TDengine 3.3.6
    的頭像 發(fā)表于 03-27 10:30 ?506次閱讀
    TDengine 發(fā)布時序<b class='flag-5'>數(shù)據(jù)分析</b> AI 智能體 TDgpt,<b class='flag-5'>核心</b>代碼開源

    七款經(jīng)久不衰的數(shù)據(jù)可視化工具!

    的圖表和交互能力,不適合企業(yè)級的復雜數(shù)據(jù)分析任務。 5. Qlik Sense 優(yōu)點:強大的數(shù)據(jù)發(fā)現(xiàn)和多維分析功能,支持自助式
    發(fā)表于 01-19 15:24

    智能焊接數(shù)據(jù)分析設備提升工業(yè)效率與精度

    如何通過數(shù)據(jù)采集、分析與應用,實現(xiàn)對焊接過程的精確控制,從而提升工業(yè)生產(chǎn)的整體水平。 首先,智能焊接數(shù)據(jù)分析設備的核心在于其強大的數(shù)據(jù)
    的頭像 發(fā)表于 01-15 14:11 ?606次閱讀

    Mathematica 在數(shù)據(jù)分析中的應用

    數(shù)據(jù)分析是現(xiàn)代科學研究和商業(yè)決策中不可或缺的一部分。隨著數(shù)據(jù)量的爆炸性增長,對數(shù)據(jù)分析工具的需求也在不斷增加。Mathematica,作為一種強大的計算軟件,以其獨特的符號計算能力和廣
    的頭像 發(fā)表于 12-26 15:41 ?1013次閱讀

    數(shù)據(jù)可視化與數(shù)據(jù)分析的關系

    在當今這個信息爆炸的時代,數(shù)據(jù)無處不在。無論是企業(yè)運營、科學研究還是個人決策,我們都需要從海量的數(shù)據(jù)中提取有價值的信息。數(shù)據(jù)分析數(shù)據(jù)可視化
    的頭像 發(fā)表于 12-06 17:09 ?1296次閱讀

    NVIDIA助力百度提升數(shù)據(jù)分析效能

    在現(xiàn)代商業(yè)環(huán)境中,數(shù)據(jù)分析已然成為企業(yè)獲取成功的關鍵所在。長期以來,百度廣告數(shù)據(jù)團隊始終面臨著極為復雜的數(shù)據(jù)分析挑戰(zhàn),其需要為逾千名用戶提供
    的頭像 發(fā)表于 11-20 10:06 ?1041次閱讀

    LLM在數(shù)據(jù)分析中的作用

    隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)分析已經(jīng)成為企業(yè)和組織決策的關鍵工具。數(shù)據(jù)科學家和分析師需要從海量
    的頭像 發(fā)表于 11-19 15:35 ?1498次閱讀

    eda與傳統(tǒng)數(shù)據(jù)分析的區(qū)別

    EDA(Exploratory Data Analysis,探索性數(shù)據(jù)分析)與傳統(tǒng)數(shù)據(jù)分析之間存在顯著的差異。以下是兩者的主要區(qū)別: 一、分析目的和方法論 EDA 目的 :EDA的主要目的是對
    的頭像 發(fā)表于 11-13 10:52 ?1163次閱讀

    為什么選擇eda進行數(shù)據(jù)分析

    數(shù)據(jù)科學領域,數(shù)據(jù)分析是一個復雜且多步驟的過程,它涉及到數(shù)據(jù)的收集、清洗、探索、建模和解釋。在這些步驟中,探索性數(shù)據(jù)分析(EDA)扮演著至關重要的角色。 1. 理解
    的頭像 發(fā)表于 11-13 10:41 ?1009次閱讀

    raid 在大數(shù)據(jù)分析中的應用

    RAID(Redundant Array of Independent Disks,獨立磁盤冗余陣列)在大數(shù)據(jù)分析中的應用主要體現(xiàn)在提高存儲系統(tǒng)的性能、可靠性和容量上。以下是RAID在大數(shù)據(jù)分析
    的頭像 發(fā)表于 11-12 09:44 ?977次閱讀

    智能制造中的數(shù)據(jù)分析應用

    隨著工業(yè)4.0的推進,智能制造已經(jīng)成為制造業(yè)轉型升級的關鍵。數(shù)據(jù)分析作為智能制造的核心驅(qū)動力,正逐步改變傳統(tǒng)的生產(chǎn)方式,為企業(yè)帶來更高的效率和更大的競爭力。 一、
    的頭像 發(fā)表于 11-07 09:56 ?1268次閱讀