2013年1月9日星期三
2013年1月6日星期日
hadoop蒙特卡洛算法续集
这个版本是参考自带samples实现。相比上个野生版本,增加修改如下特性:
【old/new】
1:生成点数由输入文本文件决定/生成点数可由命令行参数指定,据此生成相应二进制文件
2:文件中存在冗余列/二进制输入输出文件中不再有冗余列,程序中通过NullWritable来对原本冗余列的位置占位
【old/new】
1:生成点数由输入文本文件决定/生成点数可由命令行参数指定,据此生成相应二进制文件
2:文件中存在冗余列/二进制输入输出文件中不再有冗余列,程序中通过NullWritable来对原本冗余列的位置占位
2013年1月5日星期六
hadoop处女秀之蒙特卡洛算法
序,
《Hadoop In Action》里开始就推荐从观摩hadoop自带的example起步,于是走马观花的看一遍sample,里面竟然有个Dancing Link的分布式版本。当看到有一个MonteCarlo求Pi的源文件时,觉得有必要去复习一下MonteCarlo的原理。于是跑去看了一下这个随机算法的思路,看完觉着学习还是自己动手来的好,于是先不去看sample自己试着实现一下,因为这个算法很简单。不过,由于不熟悉Hadoop编程模型和IO套路甚至数据类型,又是自己操刀的第一个hadoop程序,就这样摸黑上路了,中间走了很多弯路,摘记如下。
订阅:
博文 (Atom)