pbootcms网站模板|日韩1区2区|织梦模板||网站源码|日韩1区2区|jquery建站特效-html5模板网

<small id='tJMOL'></small><noframes id='tJMOL'>

  • <tfoot id='tJMOL'></tfoot>
      <bdo id='tJMOL'></bdo><ul id='tJMOL'></ul>

    1. <legend id='tJMOL'><style id='tJMOL'><dir id='tJMOL'><q id='tJMOL'></q></dir></style></legend>
        <i id='tJMOL'><tr id='tJMOL'><dt id='tJMOL'><q id='tJMOL'><span id='tJMOL'><b id='tJMOL'><form id='tJMOL'><ins id='tJMOL'></ins><ul id='tJMOL'></ul><sub id='tJMOL'></sub></form><legend id='tJMOL'></legend><bdo id='tJMOL'><pre id='tJMOL'><center id='tJMOL'></center></pre></bdo></b><th id='tJMOL'></th></span></q></dt></tr></i><div class="rfvpxxl" id='tJMOL'><tfoot id='tJMOL'></tfoot><dl id='tJMOL'><fieldset id='tJMOL'></fieldset></dl></div>

        spark從mysql并行讀取數據

        spark reading data from mysql in parallel(spark從mysql并行讀取數據)
          <bdo id='j3z6h'></bdo><ul id='j3z6h'></ul>

        • <legend id='j3z6h'><style id='j3z6h'><dir id='j3z6h'><q id='j3z6h'></q></dir></style></legend>
          • <small id='j3z6h'></small><noframes id='j3z6h'>

            <tfoot id='j3z6h'></tfoot>
          • <i id='j3z6h'><tr id='j3z6h'><dt id='j3z6h'><q id='j3z6h'><span id='j3z6h'><b id='j3z6h'><form id='j3z6h'><ins id='j3z6h'></ins><ul id='j3z6h'></ul><sub id='j3z6h'></sub></form><legend id='j3z6h'></legend><bdo id='j3z6h'><pre id='j3z6h'><center id='j3z6h'></center></pre></bdo></b><th id='j3z6h'></th></span></q></dt></tr></i><div class="xx7flrp" id='j3z6h'><tfoot id='j3z6h'></tfoot><dl id='j3z6h'><fieldset id='j3z6h'></fieldset></dl></div>
              <tbody id='j3z6h'></tbody>

                  本文介紹了spark從mysql并行讀取數據的處理方法,對大家解決問題具有一定的參考價值,需要的朋友們下面隨著小編來一起學習吧!

                  問題描述

                  我正在嘗試從 mysql 讀取數據并將其寫回 s3 中具有特定分區的 parquet 文件,如下所示:

                  Im trying to read data from mysql and write it back to parquet file in s3 with specific partitions as follows:

                  df=sqlContext.read.format('jdbc')\
                     .options(driver='com.mysql.jdbc.Driver',url="""jdbc:mysql://<host>:3306/<>db?user=<usr>&password=<pass>""",
                           dbtable='tbl',
                           numPartitions=4 )\
                     .load()
                  
                  
                  df2=df.withColumn('updated_date',to_date(df.updated_at))
                  df2.write.parquet(path='s3n://parquet_location',mode='append',partitionBy=['updated_date'])
                  

                  我的問題是它只打開一個到 mysql 的連接(而不是 4 個),并且在它從 mysql 獲取所有數據之前它不會寫入 parquert,因為我在 mysql 中的表很大(100M 行)進程失敗內存不足.

                  My problem is that it open only one connection to mysql (instead of 4) and it doesn't write to parquert until it fetches all the data from mysql, because my table in mysql is huge (100M rows) the process failed on OutOfMemory.

                  有沒有辦法配置Spark打開多個mysql連接并將部分數據寫入parquet?

                  Is there a way to configure Spark to open more than one connection to mysql and to write partial data to parquet?

                  推薦答案

                  你應該設置這些屬性:

                  partitionColumn, 
                  lowerBound, 
                  upperBound, 
                  numPartitions
                  

                  正如這里記錄的那樣:http://spark.apache.org/docs/latest/sql-programming-guide.html#jdbc-to-other-databases

                  這篇關于spark從mysql并行讀取數據的文章就介紹到這了,希望我們推薦的答案對大家有所幫助,也希望大家多多支持html5模板網!

                  【網站聲明】本站部分內容來源于互聯網,旨在幫助大家更快的解決問題,如果有圖片或者內容侵犯了您的權益,請聯系我們刪除處理,感謝您的支持!

                  相關文檔推薦

                  How to use windowing functions efficiently to decide next N number of rows based on N number of previous values(如何有效地使用窗口函數根據 N 個先前值來決定接下來的 N 個行)
                  reuse the result of a select expression in the quot;GROUP BYquot; clause?(在“GROUP BY中重用選擇表達式的結果;條款?)
                  Does ignore option of Pyspark DataFrameWriter jdbc function ignore entire transaction or just offending rows?(Pyspark DataFrameWriter jdbc 函數的 ignore 選項是忽略整個事務還是只是有問題的行?) - IT屋-程序員軟件開發技
                  Error while using INSERT INTO table ON DUPLICATE KEY, using a for loop array(使用 INSERT INTO table ON DUPLICATE KEY 時出錯,使用 for 循環數組)
                  pyspark mysql jdbc load An error occurred while calling o23.load No suitable driver(pyspark mysql jdbc load 調用 o23.load 時發生錯誤 沒有合適的驅動程序)
                  How to integrate Apache Spark with MySQL for reading database tables as a spark dataframe?(如何將 Apache Spark 與 MySQL 集成以將數據庫表作為 Spark 數據幀讀取?)
                      <legend id='ULyWG'><style id='ULyWG'><dir id='ULyWG'><q id='ULyWG'></q></dir></style></legend>

                      • <small id='ULyWG'></small><noframes id='ULyWG'>

                        <tfoot id='ULyWG'></tfoot>

                            <tbody id='ULyWG'></tbody>
                            <bdo id='ULyWG'></bdo><ul id='ULyWG'></ul>

                            <i id='ULyWG'><tr id='ULyWG'><dt id='ULyWG'><q id='ULyWG'><span id='ULyWG'><b id='ULyWG'><form id='ULyWG'><ins id='ULyWG'></ins><ul id='ULyWG'></ul><sub id='ULyWG'></sub></form><legend id='ULyWG'></legend><bdo id='ULyWG'><pre id='ULyWG'><center id='ULyWG'></center></pre></bdo></b><th id='ULyWG'></th></span></q></dt></tr></i><div class="pntjfdf" id='ULyWG'><tfoot id='ULyWG'></tfoot><dl id='ULyWG'><fieldset id='ULyWG'></fieldset></dl></div>
                          • 主站蜘蛛池模板: 篮球架_乒乓球台_足球门_校园_竞技体育器材_厂家_价格-沧州浩然体育器材有限公司 | 铝合金脚手架厂家-专注高空作业平台-深圳腾达安全科技 | 20年条刷老厂-条刷-抛光-工业毛刷辊-惠众毛刷| 代写标书-专业代做标书-商业计划书代写「深圳卓越创兴公司」 | 橡胶弹簧|复合弹簧|橡胶球|振动筛配件-新乡市永鑫橡胶厂 | 罗氏牛血清白蛋白,罗氏己糖激酶-上海嵘崴达实业有限公司 | 不锈钢闸阀_球阀_蝶阀_止回阀_调节阀_截止阀-可拉伐阀门(上海)有限公司 | vr安全体验馆|交通安全|工地安全|禁毒|消防|安全教育体验馆|安全体验教室-贝森德(深圳)科技 | 软启动器-上海能曼电气有限公司 真空搅拌机-行星搅拌机-双行星动力混合机-广州市番禺区源创化工设备厂 | 杭州中策电线|中策电缆|中策电线|杭州中策电缆|杭州中策电缆永通集团有限公司 | 绿萝净除甲醛|深圳除甲醛公司|测甲醛怎么收费|培训机构|电影院|办公室|车内|室内除甲醛案例|原理|方法|价格立马咨询 | 精密模具加工制造 - 富东懿 | 自动螺旋上料机厂家价格-斗式提升机定制-螺杆绞龙输送机-杰凯上料机 | 泰来华顿液氮罐,美国MVE液氮罐,自增压液氮罐,定制液氮生物容器,进口杜瓦瓶-上海京灿精密机械有限公司 | 炉门刀边腹板,焦化设备配件,焦化焦炉设备_沧州瑞创机械制造有限公司 | 珠海网站建设_响应网站建设_珠海建站公司_珠海网站设计与制作_珠海网讯互联 | 上海佳武自动化科技有限公司 | 手持式浮游菌采样器-全排二级生物安全柜-浙江孚夏医疗科技有限公司 | 润东方环保空调,冷风机,厂房车间降温设备-20年深圳环保空调生产厂家 | 酵素生产厂家_酵素OEM_酵素加盟_酵素ODM_酵素原料厂家_厦门益力康 | Honsberg流量计-Greisinger真空表-气压计-上海欧臻机电设备有限公司 | 外观设计_设备外观设计_外观设计公司_产品外观设计_机械设备外观设计_东莞工业设计公司-意品深蓝 | 【孔氏陶粒】建筑回填陶粒-南京/合肥/武汉/郑州/重庆/成都/杭州陶粒厂家 | 专业广州网站建设,微信小程序开发,一物一码和NFC应用开发、物联网、外贸商城、定制系统和APP开发【致茂网络】 | 货车视频监控,油管家,货车油管家-淄博世纪锐行电子科技 | 机房监控|动环监控|动力环境监控系统方案产品定制厂家 - 迈世OMARA | 集菌仪_智能集菌仪_全封闭集菌仪_无菌检查集菌仪厂家-那艾 | 悬浮拼装地板_篮球场木地板翻新_运动木地板价格-上海越禾运动地板厂家 | 深圳市索富通实业有限公司-可燃气体报警器 | 可燃气体探测器 | 气体检测仪 | 上海租奔驰_上海租商务车_上海租车网-矢昂汽车服务公司 | 知网论文检测系统入口_论文查重免费查重_中国知网论文查询_学术不端检测系统 | pbootcms网站模板|织梦模板|网站源码|jquery建站特效-html5模板网 | 施工电梯_齿条货梯_烟囱电梯_物料提升机-河南大诚机械制造有限公司 | 真空泵厂家_真空泵机组_水环泵_旋片泵_罗茨泵_耐腐蚀防爆_中德制泵 | 仿古建筑设计-仿古建筑施工-仿古建筑公司-汉匠古建筑设计院 | 北京模型公司-工业模型-地产模型-施工模型-北京渝峰时代沙盘模型制作公司 | 冷柜风机-冰柜电机-罩极电机-外转子风机-EC直流电机厂家-杭州金久电器有限公司 | 中空玻璃生产线,玻璃加工设备,全自动封胶线,铝条折弯机,双组份打胶机,丁基胶/卧式/立式全自动涂布机,玻璃设备-山东昌盛数控设备有限公司 | 单级/双级旋片式真空泵厂家,2xz旋片真空泵-浙江台州求精真空泵有限公司 | 胶水,胶粘剂,AB胶,环氧胶,UV胶水,高温胶,快干胶,密封胶,结构胶,电子胶,厌氧胶,高温胶水,电子胶水-东莞聚力-聚厉胶粘 | 不锈钢复合板|钛复合板|金属复合板|南钢集团安徽金元素复合材料有限公司-官网 |