<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>好开发 &#187; hadoop</title>
	<atom:link href="http://www.icartype.com/?cat=15&#038;feed=rss2" rel="self" type="application/rss+xml" />
	<link>http://www.icartype.com</link>
	<description>被诅咒的程序猿</description>
	<lastBuildDate>Tue, 15 Oct 2019 01:49:00 +0000</lastBuildDate>
	<language>zh-CN</language>
		<sy:updatePeriod>hourly</sy:updatePeriod>
		<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=4.0</generator>
	<item>
		<title>大数据存储之分布式文件系统</title>
		<link>http://www.icartype.com/?p=159</link>
		<comments>http://www.icartype.com/?p=159#comments</comments>
		<pubDate>Wed, 23 Sep 2015 02:29:13 +0000</pubDate>
		<dc:creator><![CDATA[lidasheng]]></dc:creator>
				<category><![CDATA[hadoop]]></category>

		<guid isPermaLink="false">http://www.icartype.com/?p=159</guid>
		<description><![CDATA[<h1>1.Google文件系统（GFS）</h1>
<div></div>
<div>使用一堆廉价的商用计算机支撑大规模数据处理。</div>
<div></div>
<div>

GFSClient： 应用程序的访问接口

Master（主控服务器）：管理节点，在<strong>逻辑上只有一个（还有一台“影子服务器“，在主控服务器失效时提供元数据，但并不是完整的热备服务器）</strong>，保存系统的元[......]</div><p class='read-more'><a href='http://www.icartype.com/?p=159'>Read more</a></p>]]></description>
		<wfw:commentRss>http://www.icartype.com/?feed=rss2&#038;p=159</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>MapReduce初级案例</title>
		<link>http://www.icartype.com/?p=151</link>
		<comments>http://www.icartype.com/?p=151#comments</comments>
		<pubDate>Thu, 20 Aug 2015 06:56:25 +0000</pubDate>
		<dc:creator><![CDATA[lidasheng]]></dc:creator>
				<category><![CDATA[hadoop]]></category>

		<guid isPermaLink="false">http://www.icartype.com/?p=151</guid>
		<description><![CDATA[<h2>1、数据去重</h2>
"<strong>数据去重</strong>"主要是为了掌握和利用<strong>并行化思想</strong>来对数据进行<strong>有意义</strong>的<strong>筛选</strong>。<strong>统计大数据集上的数据种类个数</strong>、<strong>从网站日志中计算访问地</strong>等这些看似庞杂的任务都会涉及数据去重。下面就进入这个实例的MapReduce程序设计。
<h3>1.1 实例描述</h3>
对数据文件中的数据进行去重。数据文件中的每行都是一个数[......]<p class='read-more'><a href='http://www.icartype.com/?p=151'>Read more</a></p>]]></description>
		<wfw:commentRss>http://www.icartype.com/?feed=rss2&#038;p=151</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Hadoop示例程序WordCount详解及实例</title>
		<link>http://www.icartype.com/?p=146</link>
		<comments>http://www.icartype.com/?p=146#comments</comments>
		<pubDate>Tue, 18 Aug 2015 08:10:14 +0000</pubDate>
		<dc:creator><![CDATA[lidasheng]]></dc:creator>
				<category><![CDATA[hadoop]]></category>

		<guid isPermaLink="false">http://www.icartype.com/?p=146</guid>
		<description><![CDATA[<h2>1.图解MapReduce</h2>
MapReduce整体流程图

并行读取文本中的内容，然后进行MapReduce操作

Map过程：并行读取三行，对读取的单词进行map操作，每个词都以&#60;key,value&#62;形式生成

reduce操作是对map的结果进行排序，合并，最后得出词频[......]<p class='read-more'><a href='http://www.icartype.com/?p=146'>Read more</a></p>]]></description>
		<wfw:commentRss>http://www.icartype.com/?feed=rss2&#038;p=146</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
