GitHub

问题：

有一个 100GB 的文件，里面内容是文本，要求：

把大文件切割成若干小文件，保证每个小文件大小不超过内存限制
读取字符串同时记录索引，根据字符串哈希值取余选择一个文件，写入 "字符串|索引\n"
依次读取文件，利用hashmap,key记录字符串，value保存出现的次数和索引，遍历map取出次数为1并且索引最小的字符串遍历所有文件完成之后，即选中第一个不重复的词

 ## build 
 go build .   

 ## run 
 ./homework -file words.txt -count 10

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
README.md		README.md
file.go		file.go
go.mod		go.mod
main.go		main.go
type.go		type.go
words.txt		words.txt