hadoop​默认的转换类是什么

2023-06-26

这篇文章主要介绍“hadoop默认的转换类是什么”,在日常操作中,相信很多人在hadoop默认的转换类是什么问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”hadoop默认的转换类是什么”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

默认是下面的转换类
job.setInputFormatClass(TextInputFormat.class)

List<InputSplit> InputFormat.getSplits首先对输入的数据做切分,切分后的split书面决定map的任务数;

RecordReader<K,V> InputFormat.createRecordReader(InputSplit split, ...)传入切分的数据,处理成key、value,然后把keyvalue值送给map执行,每一对key、value对都会调用一次map;

FileInputFormat<K, V> extends InputFormat<K, V>

List<InputSplit> FileInputFormat.getSplits

TextInputFormat extends FileInputFormat<LongWritable, Text>

到此,关于“hadoop默认的转换类是什么”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注本站网站,小编会继续努力为大家带来更多实用的文章!

《hadoop​默认的转换类是什么.doc》

下载本文的Word格式文档,以方便收藏与打印。