Даний файл .txt (поки що лише англ.), в тексті якого необхідно було порахувати кількість всіх унікальних слів.
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.util.HashSet;
import java.util.Scanner;
import java.util.Set;
import java.util.regex.Pattern;
public class IOText2 {
public static void main(String args[]) throws FileNotFoundException {
Pattern p = Pattern.compile("[^(\\w')(\\w-)]"); //важливо правильно визначити regexp
Scanner scan = new Scanner(new FileReader(
"Тут//шлях//до//файлу")).useDelimiter(p);
Set<String> words = new HashSet<String>(); // дає значення, що не повторюються
while (scan.hasNext()) {
String s = scan.next();
s = s.trim();
if (!s.isEmpty())
words.add(s.toLowerCase());
}
System.out.println(words.size()); // виведе кількість унікальних слів в тексті
scan.close();
}
}
Власне, не така вже й складна задача, але мені над нею треба було посидіти. І навряд чи я б її зробила без сторонньої допомоги.
Першу спробу можна вважати завершеною.
В продовження хочу, щоб прога була мультимовною. Крім того рахувала та вивводила цитати (те, що в " " ). Якщо вийде - опублікую тут.
Немає коментарів:
Дописати коментар