Репозиторий проекта: Ссылка
Изначально я хотел найти датасет с банковскими транзакциями в котором есть фрод и провести анализ. Я начал искать и нашел довольно популярный датасет с реальными транзакциями и другими данными - Berka dataset (Czech bank dataset). Но сперва я не учел, что это данные 90-х годов и фрод с транзакциями там вряд ли будет. Еще немного поискав, в целом я понял, что реальных банковских данных, тем более с фродом, наверное не найти. Поэтому я решил сгенерировать транзакции сам при помощи python. И от Berka dataset я взял только клиентов и таблицу с районами их проживания, которые потом было решено переделать под Россию - поменять чешские районы на российские города - т.к. хотелось чтобы у транзакций были координаты реальных населенных пунктов в границах этих населенных пунктов, а для городов РФ найти их границы проще чем для чешских районов.
В итоге работать над этим я продолжил скорее не для того, чтобы потом анализировать сгенерированные данные, а именно из интереса смоделировать транзакции и создать интерфейс в виде веб-приложения для их просмотра.
На данный момент готов генератор транзакций. Веб-приложение для просмотра транзакций находится в разработке. Поэтому на данный момент я хочу продемонстрировать генератор транзакций.
Цель: генерация легальных и фрод транзакций
Используемые технологии: python и его библиотеки:
pandas, numpy, geopandas, seaborn, matplotlib и другие
Статус: готов
Установка и запуск: Readme
Диаграммы: Подробная диаграмма структуры генератора
Включает в себя
Подробнее о генераторе транзакций. По ссылке более подробное описание генерации транзакций, включая список ссылок на все Jupyter ноутбуки в формате веб-страниц и развернутые описания каждого раздела генерации.
Цель: симуляция интерфейса антифрод системы где
можно смотреть сгенерированные транзакции и данные о них.
Используемые технологии: python, python фреймворки
Streamlit или Dash для интерфейса, PostgreSQL.
Статус: в разработке.
Т.к. находится в разработке то опишу примерные идеи.