[(u'project.', 1),
(u'help', 1),
(u'when', 1),
(u'Hadoop', 3),
(u'MLlib', 1),
(u'not', 1),
(u'./dev/run-tests', 1),
(u'including', 4),
(u'graph', 1),
(u'computation', 1),
(u'file', 1),
(u'high-level', 1),
(u'find', 1),
(u'web', 1),
(u'Shell', 2),
(u'cluster', 2),
(u'also', 4),
(u'using:', 1),
(u'Big', 1),
(u'guidance', 2),
(u'run:', 1),
(u'Scala,', 1),
(u'Running', 1),
(u'should', 2),
(u'environment', 1),
(u'to', 17),
(u'only', 1),
(u'module,', 1),
(u'given.', 1),
(u'rich', 1),
(u'directory.', 1),
(u'Apache', 1),
(u'Interactive', 2),
(u'sc.parallelize(range(1000)).count()', 1),
(u'Building', 1),
(u'do', 2),
(u'guide,', 1),
(u'return', 2),
(u'which', 2),
(u'than', 1),
(u'Programs', 1),
(u'Many', 1),
(u'Try', 1),
(u'built,', 1),
(u'YARN,', 1),
(u'R,', 1),
(u'using', 5),
(u'Example', 1),
(u'scala>', 1),
(u'Once', 1),
(u'-DskipTests', 1),
(u'Spark"](http://spark.apache.org/docs/latest/building-spark.html).', 1),
(u'and', 9),
(u'Because', 1),
(u'cluster.', 1),
(u'name', 1),
(u'-T', 1),
(u'Testing', 1),
(u'optimized', 1),
(u'Streaming', 1),
(u'./bin/pyspark', 1),
(u'SQL', 2),
(u'through', 1),
(u'GraphX', 1),
(u'them,', 1),
(u'guide](http://spark.apache.org/contributing.html)', 1),
(u'[run', 1),
(u'analysis.', 1),
(u'development', 1),
(u'abbreviated', 1),
(u'set', 2),
(u'For', 3),
(u'Scala', 2),
(u'##', 9),
(u'the', 24),
(u'thread,', 1),
(u'library', 1),
(u'see', 3),
(u'individual', 1),
(u'examples', 2),
(u'MASTER', 1),
(u'[http://spark.apache.org/developer-tools.html](the', 1),
(u'runs.', 1),
(u'[Apache', 1),
(u'Pi', 1),
(u'instructions.', 1),
(u'More', 1),
(u'Python,', 2),
(u'#', 1),
(u'processing,', 1),
(u'for', 12),
(u'several', 1),
(u'review', 1),
(u'its', 1),
(u'contributing', 1),
(u'This', 2),
(u'Developer', 1),
(u'version', 1),
(u'provides', 1),
(u'print', 1),
(u'get', 1),
(u'Configuration', 1),
(u'supports', 2),
(u'command,', 2),
(u'[params]`.', 1),
(u'refer', 2),
(u'available', 1),
(u'be', 2),
(u'Guide](http://spark.apache.org/docs/latest/configuration.html)', 1),
(u'run', 7),
(u'./bin/run-example', 2),
(u'Versions', 1),
(u'["Parallel', 1),
(u'Hadoop,', 2),
(u'Documentation', 1),
(u'use', 3),
(u'downloaded', 1),
(u'distributions.', 1),
(u'Spark.', 1),
(u'example:', 1),
(u'by', 1),
(u'package.', 1),
(u'Maven](http://maven.apache.org/).', 1),
(u'["Building', 1),
(u'thread', 1),
(u'package', 1),
(u'of', 5),
(u'changed', 1),
(u'programming', 1),
(u'Spark', 16),
(u'against', 1),
(u'site,', 1),
(u'Maven,', 1),
(u'3"](https://cwiki.apache.org/confluence/display/MAVEN/Parallel+builds+in+Maven+3).',
1),
(u'or', 3),
(u'comes', 1),
(u'first', 1),
(u'info', 1),
(u'contains', 1),
(u'can', 7),
(u'overview', 1),
(u'package.)', 1),
(u'Please', 4),
(u'one', 3),
(u'Contributing', 1),
(u'(You', 1),
(u'Online', 1),
(u'tools', 1),
(u'your', 1),
(u'page](http://spark.apache.org/documentation.html).', 1),
(u'threads.', 1),
(u'Tests', 1),
(u'fast', 1),
(u'from', 1),
(u'[project', 1),
(u'APIs', 1),
(u'>>>', 1),
(u'SparkPi', 2),
(u'locally', 2),
(u'system', 1),
(u'submit', 1),
(u'`examples`', 2),
(u'systems.', 1),
(u'start', 1),
(u'IDE,', 1),
(u'params', 1),
(u'build/mvn', 1),
(u'way', 1),
(u'basic', 1),
(u'README', 1),
(u'<http://spark.apache.org/>', 1),
(u'It', 2),
(u'graphs', 1),
(u'more', 1),
(u'engine', 1),
(u'project', 1),
(u'option', 1),
(u'on', 7),
(u'started', 1),
(u'Note', 1),
(u'N', 1),
(u'usage', 1),
(u'versions', 1),
(u'DataFrames,', 1),
(u'particular', 2),
(u'instance:', 1),
(u'./bin/spark-shell', 1),
(u'general', 3),
(u'with', 4),
(u'easiest', 1),
(u'protocols', 1),
(u'must', 1),
(u'And', 1),
(u'Useful', 1),
(u'builds', 1),
(u'developing', 1),
(u'this', 1),
(u'setup', 1),
(u'shell:', 2),
(u'will', 1),
(u'`./bin/run-example', 1),
(u'following', 2),
(u'Hadoop-supported', 1),
(u'distribution', 1),
(u'Maven', 1),
(u'example', 3),
(u'are', 1),
(u'detailed', 2),
(u'Data.', 1),
(u'mesos://', 1),
(u'stream', 1),
(u'computing', 1),
(u'URL,', 1),
(u'is', 6),
(u'in', 6),
(u'higher-level', 1),
(u'tests', 2),
(u'1000:', 2),
(u'an', 4),
(u'sample', 1),
(u'To', 2),
(u'tests](http://spark.apache.org/developer-tools.html#individual-tests).',
1),
(u'tips,', 1),
(u'at', 2),
(u'have', 1),
(u'1000).count()', 1),
(u'["Specifying', 1),
(u'[building', 1),
(u'"local"', 1),
(u'You', 4),
(u'configure', 1),
(u'information', 1),
(u'different', 1),
(u'page).', 1),
(u'MASTER=spark://host:7077', 1),
(u'no', 1),
(u'programs,', 1),
(u'Java,', 1),
(u'that', 2),
(u'storage', 1),
(u'documentation,', 1),
(u'same', 1),
(u'machine', 1),
(u'how', 3),
(u'need', 1),
(u'other', 1),
(u'build', 4),
(u'prefer', 1),
(u'online', 1),
(u'you', 4),
(u'if', 4),
(u'[Contribution', 1),
(u'A', 1),
(u'About', 1),
(u'HDFS', 1),
(u'[Configuration', 1),
(u'sc.parallelize(1', 1),
(u'locally.', 1),
(u'Hive', 2),
(u'running', 1),
(u'uses', 1),
(u'a', 8),
(u'Version"](http://spark.apache.org/docs/latest/building-spark.html#specifying-the-hadoop-version)',
1),
(u'variable', 1),
(u'The', 1),
(u'data', 1),
(u'class', 2),
(u'built', 1),
(u'building', 2),
(u'"yarn"', 1),
(u'Thriftserver', 1),
(u'processing.', 1),
(u'programs', 2),
(u'Tools', 1),
(u'documentation', 3),
(u'pre-built', 1),
(u'Alternatively,', 1),
(u'Python', 2),
(u'core', 1),
(u'"local[N]"', 1),
(u'Spark](#building-spark).', 1),
(u'clean', 1),
(u'<class>', 1),
(u'spark://', 1),
(u'learning,', 1),
(u'requires', 1),
(u'talk', 1),
(u'latest', 1)]