数据库

 首页 > 数据库 > MySql > apache hadoop 2.4.0 64bit 在windows8.1下直接安装指南(无需虚拟机和cygwin)

apache hadoop 2.4.0 64bit 在windows8.1下直接安装指南(无需虚拟机和cygwin)

分享到:
【字体:
导读:
         摘要:apache hadoop 2.4.0 64bit 在windows8.1下直接安装指南(无需虚拟机和cygwin) ...

apache hadoop 2.4.0 64bit 在windows8.1下直接安装指南(无需虚拟机和cygwin)

工作需要,要开始搞hadoop了,又是大数据,自己感觉大数据、云,只是ERP、SOAP风潮之后与智能地球一起诞生的概念炒作。不过Apache是个神奇的组织,Java如果没有它也不会现在如火中天。言归正传:

首先需要下载Apache hadoop 2.4.0的tar.gz包,到本地解压缩到某个盘下,注意路径里不要带空格。否则你配置文件里需要用windows 8.3格式的路径!

第二确保操作系统是64bit,已安装.netframework4.0以上版本,这个你懂的,微软的天下,没有这个怎么混!

第三确保安装了64 bit 版本的JDK1.7,笔者使用的就是JDK1.7.

第四请到github下载hadoop-commin-2.2.zip,官方下载的Apache hadoop 2.4.0的压缩包里,缺少windows下运行的链接库(hadoop.dll,winutils.exe,libwinutils.lib等),这个github的是大佬们编译好的64bit版的链接库包。下载直接解压缩,覆盖掉官方hadoop目录下的bin目录即可。

如果你想在windows下编译安装hadoop,则请直接参考官方原版文档:Hadoop2.X Windows安装指南

接下来进行配置(大部分摘抄自官方文档):

我的Hadoop解压缩目录是D:Hadoop_2_4_0,以下简称h_home

首先,修改%h_home%etchadoop的hadoop-env.cmd脚本文件,在文件末尾增加环境变量定义。注意找到文件最初的JAVA_HOME设置,改成你的64位JDK路径,这一点一定要注意!比如我的:“set  JAVA_HOME=D:OLD_JDKjdk1.7.0_51”

set HADOOP_PREFIX=c:deploy
set HADOOP_CONF_DIR=%HADOOP_PREFIX%etchadoop
set YARN_CONF_DIR=%HADOOP_CONF_DIR%
set PATH=%PATH%;%HADOOP_PREFIX%bin

之后在该路径下找到或创建core-site.xml文件,修改内容如下:


  
    fs.default.name
    hdfs://0.0.0.0:19000
  

接下来是 hdfs-site.xml 文件,一样的修改内容如下。配置文件默认使用tmp目录作为hdfs文件的存储位置,比如我解压hadoop在D:下,则它就会创建D:tmp来存放HDFS文件系统。


  
    dfs.replication
    1
  

基本配置ok。

接下来我们配置一个YARN示例:

还是在该配置文件路径下,修改或者创建一个mapred-site.xml文件,路径下有个同名的模板文件,可以直接复制,然后修改其中的内容。注意替换配置文件中%USERNAME% 为你windows的用户名。



   
     mapreduce.job.user.name
     %USERNAME%
   

   
     mapreduce.framework.name
     yarn
   

  
    yarn.apps.stagingDir
    /user/%USERNAME%/staging
  

  
    mapreduce.jobtracker.address
    local
  


最后,创建yarn-site.xml文件,变更内容如下:


  
    yarn.server.resourcemanager.address
    0.0.0.0:8020
  

  
    yarn.server.resourcemanager.application.expiry.interval
    60000
  

  
    yarn.server.nodemanager.address
    0.0.0.0:45454
  

  
    yarn.nodemanager.aux-services
    mapreduce_shuffle
  

  
    yarn.nodemanager.aux-services.mapreduce.shuffle.class
    org.apache.hadoop.mapred.ShuffleHandler
  

  
    yarn.server.nodemanager.remote-app-log-dir
    /app-logs
  

  
    yarn.nodemanager.log-dirs
    /dep/logs/userlogs
  

  
    yarn.server.mapreduce-appmanager.attempt-listener.bindAddress
    0.0.0.0
  

  
    yarn.server.mapreduce-appmanager.client-service.bindAddress
    0.0.0.0
  

  
    yarn.log-aggregation-enable
    true
  

  
    yarn.log-aggregation.retain-seconds
    -1
  

  
    yarn.application.classpath
    %HADOOP_CONF_DIR%,%HADOOP_COMMON_HOME%/share/hadoop/common/*,%HADOOP_COMMON_HOME%/share/hadoop/common/lib/*,%HADOOP_HDFS_HOME%/share/hadoop/hdfs/*,%HADOOP_HDFS_HOME%/share/hadoop/hdfs/lib/*,%HADOOP_MAPRED_HOME%/share/hadoop/mapreduce/*,%HADOOP_MAPRED_HOME%/share/hadoop/mapreduce/lib/*,%HADOOP_YARN_HOME%/share/hadoop/yarn/*,%HADOOP_YARN_HOME%/share/hadoop/yarn/lib/*
  


ok,全部配置都改完了。点击命令提示符(管理员)运行命令提示符,切换到hadoop的安装目录。进行以下操作

1、切换到etc/hadoop目录,运行hadoop-env.cmd脚本,设置当前命令窗口执行环境变量。

2、格式化HDFS文件系统(建议切换到bin目录然后执行命令):

%HADOOP_PREFIX%binhdfs namenode -format
3、运行HDFS示例:
%HADOOP_PREFIX%sbinstart-dfs.cmd


不报错的话,部署就ok了!!!

apache hadoop 2.4.0 64bit 在windows8.1下直接安装指南(无需虚拟机和cygwin)
分享到:
extended-insert对mysqldump及导入性能的...
extended-insert对mysqldump及导入性能的影响1. 环境描述 SuSE 11 sp1 x86_64  +  MySQL 5.5.37 blog地址:http://blog.csdn.net/hw_libo/article/details/39583247 测试表order_line有3.2亿数据,大小约37G: NDSC02:/data/mysql/mysql3306/data/tpcc1000 # du -shl order_line.* 12K order_line.frm 37G order_line.ib...
使用bbed编辑研究oracle数据块结构
使用bbed编辑研究oracle数据块结构bbed是随oracle软件发布的一款数据块查看和编辑工具,作为一款内部工具,bbed的功能非常强大,但是如果使用不当可能给数据库造成无法挽回的损失。因此。我们建议在使用bbed修改数据块前备份被修改的数据文件,并且在成功修复数据块后立即将数据库数据导出,并新建数据库。   编辑并使用bb...
  •         php迷,一个php技术的分享社区,专属您自己的技术摘抄本、收藏夹。
  • 在这里……