[B! spark] dowhileのブックマーク

SpaRC: Scalable Sequence Clustering using Apache Spark - High-Performance Computing News Analysis | insideHPC

dowhile 2018/03/01

リンク

O'Reilly Japan - 入門 PySpark

PythonからSparkを利用するための機能、PySparkを使いこなすテクニックとノウハウを習得する書籍です。はじめに高速になったSpark 2.0の特徴とアーキテクチャを解説し、次に構造化及び非構造化データの読み取り、PySparkで利用できる基本的なデータ型、MLlibとMLパッケージによる機械学習モデルの構築を説明します。さらにGraphFramesを使ったグラフの操作、ストリーミングデータの読み取り、クラウドへのモデルのデプロイなどの方法を豊富なサンプルと一緒に学びます。またローカルでのSpark＋Python＋Jupyter環境の構築方法も紹介。大規模なデータを処理し、活用したいエンジニア必携の一冊です。序文訳者まえがきはじめに 1章　Sparkを理解する 1.1　Apache Sparkとは 1.2　Sparkのジョブと

dowhile 2017/11/22

リンク

Cloudera Altusを使ってみた | DevelopersIO

こんにちは、小澤です。 Clouderaが提供するクラウド上でHadoopを扱うためのサービスであるCloudera Altusを使ってみました。 Cloudera Altusとは AltusがどういったものなのかについてはClouderaの公式ブログに記載があります。 Cloudera Altus によるデータエンジニアリング – Cloudera Japan Official Blog Altusの構成としてはWebUIやCLIからクラスタの作成・ジョブの投入を行うためのAltus Data Engineeringと、実際にHadoopクラスタが動く

dowhile 2017/10/04

cloud
spark

リンク

Scalable real-time processing with Spark Streaming: implementation and design of a Car Information System

dowhile 2017/09/30

spark

リンク

Amazon.co.jp: Scala for Spark in Production: Fast distributed computing in the enterprise: Khrabrov, Alexy, Petrella, Andy, Tordoir, Xavier: 本

dowhile 2017/08/28

リンク

Sparkによる実践データ解析

本書は、データサイエンスの4人のエキスパートがSparkでの高度な分析方法を解説するとともに、より実践的なデータサイエンスを学ぶ書籍です。ビッグデータ分析におけるSparkの位置づけを紹介し、ベストな結果を得るためのデータの準備やモデルのチューニングについて解説します。またデータクレンジングのユースケースを通じてSparkとScalaによるデータ処理の基本を学習し、Sparkを使った機械学習の基礎や応用分野における広く使われる一般的なアルゴリズムを紹介します。日本語版では付録として高柳慎一氏と牧山幸史氏による「SparkRについて」と千葉立寛氏、小野寺民也氏による「SparkのJVM、システムレベルのチューニングによる高速化」を掲載。高度なデータ解析を習得したいデータサイエンティスト必携の一冊です。目次序文訳者まえがきはじめに 1章　ビッグデータの分析 1.1　データサイエンスの挑

dowhile 2016/03/03

リンク

はてなブックマーク

タグ

関連タグで絞り込む (7)

sparkに関するdowhileのブックマーク (6)

お知らせ

はてなブックマークの計画メンテナンスのお知らせ（2025年1月31日(金) 深夜1:30〜3:00）

ブックマークしたエントリーのタイトル変更機能の提供を一時的に停止します

【復旧済】「マイホットエントリー」「お気に入り」「関心ワード」が利用できない障害が発生していました

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス