Перейти к содержимому

! ___ ПО для индексации файлов — DocFetcher, Everything, Recoll, Python и индексация по содержимому файлов в операционной системе Window 11.

DocFetcher — https://docfetcher.sourceforge.io
Everything — https://www.voidtools.com/
Recoll — https://www.recoll.org/
Python — нужно икать софт.

Конечно! Вот несколько полезных ссылок на программы на Python, которые могут индексировать содержимое файлов в Windows 11:

  1. fsindex: Это небольшой утилита на Python для индексирования файлов в Windows. Она поддерживает многопоточность, регулярные выражения для поиска, нахождение дубликатов файлов и экспорт данных в формат CSV1. GitHub — fsindex

https://github.com/HizkiFW/fsindex — FS Индекс. Небольшая утилита Python для индексации файлов. В настоящее время работает только в Windows и Python 2.7. Она также потребляет довольно много оперативной памяти, так что эта часть может нуждаться в некоторых улучшениях.


на базе Python 3

import os
import sqlite3

# Создание базы данных для хранения информации об индексированных файлах
conn = sqlite3.connect('file_index.db')
c = conn.cursor()
c.execute('''
CREATE TABLE IF NOT EXISTS files (
    id INTEGER PRIMARY KEY,
    path TEXT NOT NULL,
    content TEXT
)
''')
conn.commit()

def index_files(directory):
    for root, dirs, files in os.walk(directory):
        for file in files:
            file_path = os.path.join(root, file)
            try:
                with open(file_path, 'r', encoding='utf-8') as f:
                    content = f.read()
                c.execute('INSERT INTO files (path, content) VALUES (?, ?)', (file_path, content))
                conn.commit()
            except Exception as e:
                print(f"Could not read {file_path}: {e}")

def search_files(keyword):
    c.execute('SELECT path FROM files WHERE content LIKE ?', ('%' + keyword + '%',))
    return c.fetchall()

# Индексирование файлов в указанной директории
index_files('C:/your_directory')

# Поиск по ключевому слову
results = search_files('your_keyword')
for result in results:
    print(result[0])

conn.close()

Этот скрипт на Python 3 выполняет следующие действия:

  1. Создает базу данных SQLite для хранения информации об индексированных файлах.
  2. Проходит по всем файлам в указанной директории и сохраняет их содержимое в базу данных.
  3. Позволяет искать файлы по ключевым словам в их содержимом.

Вы можете настроить скрипт под свои нужды, указав соответствующую директорию и ключевые слова. Если у вас есть вопросы или нужна помощь в настройке, дайте знать!

Добавить комментарий