Перечислите уникальные слова в файле Microsoft Word в C#
Пример
Прежде чем начать, добавьте ссылку на библиотеку объектов Microsoft Word 12.0 (или любую другую версию, установленную в вашей системе). Затем добавьте следующий с помощью оператора, чтобы упростить работу с пространством имен Word. Часть Word = означает, что вы можете использовать Word как псевдоним для пространства имен.
using Word = Microsoft.Office.Interop.Word;
Следующий код показывает, как программа получает слова из файла Word.
// Прочитайте текстовое содержимое файла Word. private string GrabWordFileWords(string file_name) { // Получить объект приложения Word. Word._Application word_app = new Word.ApplicationClass(); // Сделать Word видимым (необязательно). word_app.Visible = false; // Откройте файл. object filename = file_name; object confirm_conversions = false; object read_only = true; object add_to_recent_files = false; object format = 0; object missing = System.Reflection.Missing.Value; Word._Document word_doc = word_app.Documents.Open(ref filename, ref confirm_conversions, ref read_only, ref add_to_recent_files, ref missing, ref missing, ref missing, ref missing, ref missing, ref format, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing); // Возвращаем текст документа. string result = word_doc.Content.Text; // Закройте документ без подсказки. object save_changes = false; word_doc.Close(ref save_changes, ref missing, ref missing); word_app.Quit(ref save_changes, ref missing, ref missing); // Вернуть результат. return result; }
Сначала код создает сервер приложений Word. Он устанавливает свойство Visible сервера false, чтобы оно не отображалось, но вы можете изменить его, если хотите.
Затем программа открывает документ Word. Затем он использует свойство Content.Text документа для получения текста файла.