#CSV

Как перемешать строки в CSV файле — 4 способа рандомизации

Равномерное распределение нагрузки, честные A/B-тесты, разрушение последовательных паттернов — всё это требует случайного порядка данных. Разбираем четыре способа перемешать CSV: Excel RAND(), командная строка, Python random.shuffle и Basalt. Объясняем алгоритм Fisher-Yates и проверку качества случайности.

Марина Козлова · · Руководства

Как удалить дубликаты из CSV файла — 4 способа + сравнение

Дубликаты в базе данных — это лишние расходы и испорченная репутация. Разбираем четыре способа очистки CSV от повторяющихся записей: от Excel до специализированных инструментов. Сравниваем производительность на больших файлах и делимся практическими советами.

Марина Козлова · · Руководства

Как вычесть одну базу номеров из другой: сравнение алгоритмов

Разбираем четыре способа вычитания баз данных — от Excel до оптимизированных Set-based алгоритмов. Детальное сравнение производительности: O(n²) vs O(n). Замеры на реальных данных, объяснение сложности алгоритмов.

Алексей Петров · · Руководства

Как объединить несколько CSV файлов в один: 4 способа с дедупликацией

Разбираем четыре способа объединения CSV-файлов — от примитивного копирования до автоматической дедупликации. Сравниваем производительность, объясняем проблему дубликатов, выбираем оптимальный метод для работы с телефонными базами.

Алексей Петров · · Руководства

Как разделить CSV файл на несколько частей: 4 проверенных способа

Разбираем четыре способа разделения больших CSV-файлов — от ручного редактирования до специализированных инструментов. Сравниваем производительность, оцениваем трудозатраты, выбираем оптимальный метод для разных задач.

Алексей Петров · · Руководства