Руководства

Как сгенерировать номера телефонов по DEF-кодам — полное руководство

DEF-код — трёхзначный код оператора в российском мобильном номере. Зная его, можно сгенерировать миллионы номеров для тестирования или анализа. Разбираем структуру DEF-кодов, способы генерации (Excel, Python, Basalt), распределение по операторам и правовые аспекты использования.

Марина Козлова · · Руководства

Как перемешать строки в CSV файле — 4 способа рандомизации

Равномерное распределение нагрузки, честные A/B-тесты, разрушение последовательных паттернов — всё это требует случайного порядка данных. Разбираем четыре способа перемешать CSV: Excel RAND(), командная строка, Python random.shuffle и Basalt. Объясняем алгоритм Fisher-Yates и проверку качества случайности.

Марина Козлова · · Руководства

Как извлечь номера телефонов из текста — парсинг и нормализация

Веб-скрапинг, экспорты из CRM, неструктурированные данные — номера телефонов часто перемешаны с текстом. Разбираем три способа автоматического извлечения: regex, библиотека phonenumbers и Basalt. Показываем, как нормализовать форматы и избежать типичных ошибок.

Марина Козлова · · Руководства

Как удалить дубликаты из CSV файла — 4 способа + сравнение

Дубликаты в базе данных — это лишние расходы и испорченная репутация. Разбираем четыре способа очистки CSV от повторяющихся записей: от Excel до специализированных инструментов. Сравниваем производительность на больших файлах и делимся практическими советами.

Марина Козлова · · Руководства

Как извлечь номера телефонов из Excel: решение проблем формата

Парсинг Excel отличается от CSV — научная нотация, ведущие нули, многолистовые книги. Разбираем три способа извлечения номеров: ручной, Python (openpyxl/pandas), специализированные инструменты. С примерами кода и объяснением подводных камней.

Алексей Петров · · Руководства

Как вычесть одну базу номеров из другой: сравнение алгоритмов

Разбираем четыре способа вычитания баз данных — от Excel до оптимизированных Set-based алгоритмов. Детальное сравнение производительности: O(n²) vs O(n). Замеры на реальных данных, объяснение сложности алгоритмов.

Алексей Петров · · Руководства

Как объединить несколько CSV файлов в один: 4 способа с дедупликацией

Разбираем четыре способа объединения CSV-файлов — от примитивного копирования до автоматической дедупликации. Сравниваем производительность, объясняем проблему дубликатов, выбираем оптимальный метод для работы с телефонными базами.

Алексей Петров · · Руководства

Как разделить CSV файл на несколько частей: 4 проверенных способа

Разбираем четыре способа разделения больших CSV-файлов — от ручного редактирования до специализированных инструментов. Сравниваем производительность, оцениваем трудозатраты, выбираем оптимальный метод для разных задач.

Алексей Петров · · Руководства