import pandas as pd
import numpy as np
import os
import pyarrow
import yaml

from data_generator.general_time import *
from data_generator.utils import load_configs

np.set_printoptions(suppress=True)
pd.set_option('display.max_columns', None)

os.chdir("..")
os.getcwd()

'C:\\Users\\iaros\\My_documents\\Education\\projects\\fraud_detection_01'

# Базовые конфиги
base_cfg = load_configs("./config/base.yaml")
# Настройки легальных транзакций
legit_cfg = load_configs("./config/legit.yaml")
# Общие настройки фрода
fraud_cfg = load_configs("./config/fraud.yaml")
# Настройки для дроп фрода
drops_cfg = load_configs("./config/drops.yaml")
# Настройки времени
time_cfg = load_configs("./config/time.yaml") 

# Пути к файлам
data_paths = base_cfg["data_paths"]

# директорию текущего запуска генератора возьмем из предыдущего ноутбука. Т.к. нужны данные того, что сгенерировано до дроп фрода
run_dir = './data/generated/history/generation_run_2025-07-25_121029'

from data_generator.fraud.drops.build.config import DropConfigBuilder

# объект самого конфиг билдера
cfg_build = DropConfigBuilder(base_cfg=base_cfg, legit_cfg=legit_cfg, time_cfg=time_cfg, fraud_cfg=fraud_cfg, \
                              drop_cfg=drops_cfg, run_dir=run_dir)

# Конфиг класс для дропов распределителей
dist_configs = cfg_build.build_dist_cfg()
# Конфиг класс для дропов покупателей
purch_configs = cfg_build.build_purch_cfg()

# Клиенты семплированные под дропов распределителей т.е. они будут дропами
dist_configs.clients.head(2)

# Клиенты семплированные под дропов покупателей т.е. они будут дропами
purch_configs.clients.head(2)

# таблица со счетами клиентов и информацией о том дропы ли они.
# клиент помечается как дроп только когда непосредственно идет генерация его активности
dist_configs.accounts.head(2)

from data_generator.fraud.drops.base import DropAccountHandler

acc_hand = DropAccountHandler(configs=dist_configs)
# DropAccountHandler нуждается в передаче ему client_id, чтобы знать чей счет искать если нужен счет самого дропа 
# и чей счет исключить если это счет под исходящюю транзакцию
acc_hand.client_id = 1

acc_hand.get_account(own=True)
acc_hand.account

np.int64(10000)

acc_hand.get_account()

np.int64(23260)

# смотрим до вызова метода. Клиент не помечен как дроп: is_drop = False
accounts = acc_hand.accounts
own_id = acc_hand.client_id
accounts.query("client_id == @own_id")

# Отмечаем клиента как дропа
acc_hand.label_drop()

# Снова смотрим на него в accounts
accounts.query("client_id == @own_id")

from data_generator.fraud.drops.base import DropAmountHandler

amt_hand = DropAmountHandler(configs=dist_configs)

# текущий баланс
amt_hand.balance

0

# сумма вх. перевода. Успешная транз
amt_hand.receive(declined=False)

np.float64(30700.0)

# Баланс
amt_hand.balance

np.float64(30700.0)

# сумма вх. перевода. Отклоненная транз
amt_hand.receive(declined=True)

np.float64(34300.0)

# Баланс
amt_hand.balance

np.float64(30700.0)

# Баланс
amt_hand.balance

np.float64(30700.0)

# Например текущая транзакция онлайн, она не отклонена и нужно перевести только часть баланса
amt_hand.one_operation(online=True, declined=False, in_chunks=True)

np.float64(20000.0)

amt_hand.balance

np.float64(10700.0)

amt_hand.reset_cache(all=True)
amt_hand.balance = 47000
print(f"Баланс перед запуском цикла: {amt_hand.balance}")

all_ops = []
while True:
    one_op = int(amt_hand.one_operation(online=True, declined=True, in_chunks=True))
    
    all_ops.append(one_op)
    if len(all_ops) == 5:
        break
print(f"""Итоговый баланс: {amt_hand.balance}
Все созданные суммы: {all_ops}""")

Баланс перед запуском цикла: 47000
Итоговый баланс: 47000
Все созданные суммы: [24000, 18000, 12000, 6000, 3000]

from data_generator.fraud.drops.time import DropTimeHandler

time_hand = DropTimeHandler(configs=dist_configs)

all_times = []

in_txns = 0
txn_time, _ = time_hand.get_txn_time(receive=True, in_txns=in_txns) # первая транзакция. Входящая
in_txns += 1
all_times.append(txn_time)

for _ in range(12): # цикл исходящих транзакций.
    txn_time, _ = time_hand.get_txn_time(receive=False, in_txns=in_txns)
    all_times.append(txn_time)
    
all_times = pd.DataFrame({"txn_time":all_times})
all_times["time_diff"] = all_times.txn_time - all_times.txn_time.shift(1)
all_times

from data_generator.fraud.drops.behavior import DistBehaviorHandler
from data_generator.fraud.drops.base import DropAmountHandler

amt_hand = DropAmountHandler(configs=dist_configs)
dist_behav = DistBehaviorHandler(configs=dist_configs, amt_hand=amt_hand)

all_scens = [] # Все случаи выбора сценария
i = 0
while i < 2000:
    amt_hand.reset_cache()
    amt_hand.balance = dist_behav.trf_max + 1000
    assert amt_hand.balance > dist_behav.trf_max, "Balance is below trf_max"
    dist_behav.sample_scenario()
    all_scens.append(dist_behav.scen)
    i += 1
all_scens_ser = pd.Series(all_scens)
all_scens_ser.value_counts(normalize=True)

split_transfer    0.3475
atm+transfer      0.3430
atm               0.3095
Name: proportion, dtype: float64

all_scens = []
i = 0
while i < 2000:
    amt_hand.reset_cache()
    amt_hand.balance = dist_behav.atm_min + 1000
    assert amt_hand.balance < dist_behav.trf_max, "Balance exceeds trf_max"
    dist_behav.sample_scenario()
    all_scens.append(dist_behav.scen)
    i += 1
all_scens_ser = pd.Series(all_scens)
all_scens_ser.value_counts(normalize=True)

atm+transfer      0.3465
split_transfer    0.3430
transfer          0.1555
atm               0.1550
Name: proportion, dtype: float64

all_scens = []
i = 0
while i < 3000:
    amt_hand.reset_cache()
    amt_hand.balance = dist_behav.trf_min * 2
    assert amt_hand.balance < dist_behav.atm_min, "Balance exceeds atm_min"
    assert amt_hand.balance < dist_behav.trf_max, "Balance exceeds trf_max"
    dist_behav.sample_scenario()
    all_scens.append(dist_behav.scen)
    i += 1
all_scens_ser = pd.Series(all_scens)
all_scens_ser.value_counts(normalize=True)

split_transfer    0.704
transfer          0.296
Name: proportion, dtype: float64

all_scens = []
i = 0
while i < 3000:
    amt_hand.reset_cache()
    amt_hand.balance = dist_behav.trf_min + 1000
    assert amt_hand.balance < dist_behav.trf_min * 2, "Balance exceeds the limit"
    dist_behav.sample_scenario()
    all_scens.append(dist_behav.scen)
    i += 1
all_scens_ser = pd.Series(all_scens)
all_scens_ser.value_counts(normalize=True)

transfer    1.0
Name: proportion, dtype: float64

from data_generator.fraud.drops.behavior import PurchBehaviorHandler
from data_generator.fraud.drops.base import DropAmountHandler

amt_hand = DropAmountHandler(configs=purch_configs)
purch_behav = PurchBehaviorHandler(configs=purch_configs, amt_hand=amt_hand)

all_scens = []
i = 0
while i < 2000:
    amt_hand.reset_cache()
    amt_hand.balance = purch_behav.amt_max + 1000
    assert amt_hand.balance > purch_behav.amt_max, "Balance is below amt_max"
    purch_behav.sample_scenario()
    all_scens.append(purch_behav.scen)
    i += 1
    
all_scens_ser = pd.Series(all_scens)
all_scens_ser.value_counts(normalize=True)

split_money    1.0
Name: proportion, dtype: float64

all_scens = []
i = 0
while i < 3000:
    amt_hand.reset_cache()
    amt_hand.balance = purch_behav.amt_min * 2
    assert amt_hand.balance < purch_behav.amt_max, "Balance exceeds amt_max"
    purch_behav.sample_scenario()
    all_scens.append(purch_behav.scen)
    i += 1
    
all_scens_ser = pd.Series(all_scens)
all_scens_ser.value_counts(normalize=True)

split_money     0.689667
one_purchase    0.310333
Name: proportion, dtype: float64

all_scens = []
i = 0
while i < 3000:
    amt_hand.reset_cache()
    amt_hand.balance = purch_behav.amt_min + 1000
    assert amt_hand.balance < purch_behav.amt_min * 2, "Balance exceeds the limit"
    purch_behav.sample_scenario()
    all_scens.append(purch_behav.scen)
    i += 1
    
all_scens_ser = pd.Series(all_scens)
all_scens_ser.value_counts(normalize=True)

one_purchase    1.0
Name: proportion, dtype: float64

	client_id	birth_date	sex	region	city	lat	lon	city_id	home_ip
0	4344	1950-06-09	male	Свердловская	Екатеринбург	56.838633	60.605489	54	2.60.16.18
1	2692	1950-05-24	male	Ставропольский	Ставрополь	45.044544	41.969017	44	2.60.9.247

	client_id	birth_date	sex	region	city	lat	lon	city_id	home_ip
0	901	1944-12-14	male	Смоленская	Смоленск	54.786717	31.815337	39	2.60.3.87
1	3839	1962-06-29	female	Ростовская	Таганрог	47.209491	38.935154	65	2.60.14.50

	txn_time	time_diff
0	2025-01-14 09:27:00	NaT
1	2025-01-14 10:35:00	0 days 01:08:00
2	2025-01-14 12:17:00	0 days 01:42:00
3	2025-01-14 13:11:00	0 days 00:54:00
4	2025-01-14 16:10:00	0 days 02:59:00
5	2025-01-14 18:55:00	0 days 02:45:00
6	2025-01-15 10:22:00	0 days 15:27:00
7	2025-01-15 11:52:00	0 days 01:30:00
8	2025-01-15 13:15:00	0 days 01:23:00
9	2025-01-15 15:02:00	0 days 01:47:00
10	2025-01-15 16:58:00	0 days 01:56:00
11	2025-01-16 09:02:00	0 days 16:04:00
12	2025-01-16 10:37:00	0 days 01:35:00

Дроп фрод основные инструменты¶

Создание конфиг классов с конфигами и данными для генерации¶

1. Класс `DropConfigBuilder`¶

Демонстрация¶

Управление счетами транзакций. Генерация сумм транзакций и времени¶

1. Класс `DropAccountHandler`¶

Демонстрация¶

2. Класс `DropAmountHandler`¶

Демонстрация¶

3. Класс `DropTimeHandler`¶

Демонстрация¶

Управление поведением дропов¶

1. Класс `DistBehaviorHandler`¶

Демонстрация¶

2. Класс `PurchBehaviorHandler`¶

Демонстрация¶

Дроп фрод основные инструменты¶

Создание конфиг классов с конфигами и данными для генерации¶

1. Класс DropConfigBuilder¶

Демонстрация¶

Управление счетами транзакций. Генерация сумм транзакций и времени¶

1. Класс DropAccountHandler¶

Демонстрация¶

2. Класс DropAmountHandler¶

Демонстрация¶

3. Класс DropTimeHandler¶

Демонстрация¶

Управление поведением дропов¶

1. Класс DistBehaviorHandler¶

Демонстрация¶

2. Класс PurchBehaviorHandler¶

Демонстрация¶

1. Класс `DropConfigBuilder`¶

1. Класс `DropAccountHandler`¶

2. Класс `DropAmountHandler`¶

3. Класс `DropTimeHandler`¶

1. Класс `DistBehaviorHandler`¶

2. Класс `PurchBehaviorHandler`¶