liulujian/deep-risk

Fork 0

zerosaturation 4f1ff76cd1 feat: 风控程序 v1版本

2025-12-14 20:08:27 +08:00

11 KiB

Raw Permalink Blame History

收入完整性检测算法测试指南

📋 测试概览

本测试数据集为收入完整性检测算法提供8个不同风险等级的专项测试场景，总计 280 条记录，涵盖从正常到严重风险的全方位测试案例。

数据统计

主播信息: 8 条
分成协议: 24 条
充值记录: 240 条
税务申报: 8 条
测试场景: 8 个
数据期间: 2024年1月

🎯 测试场景详细说明

场景1: 严重漏报场景 (CRITICAL)

主播ID: TEST_001
风险等级: CRITICAL (严重)
测试重点: 测试算法对严重漏报行为的检测能力

数据特征:

充值总额: ¥455,375.00
申报金额: ¥100,000.00
差异金额: ¥355,375.00
差异率: 78.04%

预期结果:

风险等级: CRITICAL
风险评分: 90-100分
风险类型: 严重收入漏报

触发条件:

差异率 (78.04%) > 50% (严重风险阈值) ✓
差异金额 (355,375元) > 100,000元 (严重风险阈值) ✓

场景2: 高风险场景 (HIGH)

主播ID: TEST_002
风险等级: HIGH (高风险)
测试重点: 测试算法对高风险漏报行为的检测能力

数据特征:

充值总额: ¥298,428.00
申报金额: ¥180,000.00
差异金额: ¥118,428.00
差异率: 39.68%

预期结果:

风险等级: HIGH
风险评分: 75-90分
风险类型: 明显收入漏报

触发条件:

差异率 (39.68%) > 30% (高风险阈值) ✓
差异金额 (118,428元) > 50,000元 (高风险阈值) ✓

场景3: 中风险场景 (MEDIUM)

主播ID: TEST_003
风险等级: MEDIUM (中风险)
测试重点: 测试算法对中等程度漏报的检测能力

数据特征:

充值总额: ¥98,213.00
申报金额: ¥85,000.00
差异金额: ¥13,213.00
差异率: 13.45%

预期结果:

风险等级: MEDIUM
风险评分: 50-75分
风险类型: 中等收入差异

触发条件:

差异率 (13.45%) > 10% (中风险阈值) ✓
差异金额 (13,213元) > 10,000元 (中风险阈值) ✓

场景4: 低风险场景 (LOW)

主播ID: TEST_004
风险等级: LOW (低风险)
测试重点: 测试算法对轻微收入差异的处理能力

数据特征:

充值总额: ¥47,792.00
申报金额: ¥47,000.00
差异金额: ¥792.00
差异率: 1.66%

预期结果:

风险等级: LOW
风险评分: 25-50分
风险类型: 轻微收入差异

触发条件:

差异率 (1.66%) < 5% (低风险阈值)
差异金额 (792元) < 5,000元 (低风险阈值)
但是 差异金额 > 0，所以触发LOW风险

场景5: 正常场景 (LOW)

主播ID: TEST_005
风险等级: LOW (低风险)
测试重点: 测试算法对正常数据的处理能力

数据特征:

充值总额: ¥96,221.00
申报金额: ¥98,000.00
差异金额: -¥1,779.00 (申报超额)
差异率: -1.85%

预期结果:

风险等级: LOW
风险评分: 0-25分
风险类型: 基本无风险

说明:

申报金额 > 充值金额，属于正常误差范围
差异率 (-1.85%) 在可接受范围内

场景6: 完全未申报场景 (CRITICAL)

主播ID: TEST_006
风险等级: CRITICAL (严重)
测试重点: 测试算法对极端情况的检测能力

数据特征:

充值总额: ¥748,729.00
申报金额: ¥0.00
差异金额: ¥748,729.00
差异率: 100.00%

预期结果:

风险等级: CRITICAL
风险评分: 95-100分
风险类型: 完全未申报收入

触发条件:

差异率 (100.00%) > 50% (严重风险阈值) ✓
差异金额 (748,729元) > 100,000元 (严重风险阈值) ✓

场景7: 多平台收入场景 (HIGH)

主播ID: TEST_007
风险等级: HIGH (高风险)
测试重点: 测试算法对多平台收入合并申报的检测能力

数据特征:

充值总额: ¥150,251.00
申报金额: ¥50,000.00
差异金额: ¥100,251.00
差异率: 66.72%

预期结果:

风险等级: HIGH
风险评分: 80-90分
风险类型: 多平台收入漏报

触发条件:

差异率 (66.72%) > 50% (严重风险阈值) ✓
差异金额 (100,251元) > 100,000元 (严重风险阈值) ✓
可能被评为CRITICAL或HIGH

场景8: 分批申报场景 (MEDIUM)

主播ID: TEST_008
风险等级: MEDIUM (中风险)
测试重点: 测试算法对分批申报行为的检测能力

数据特征:

充值总额: ¥117,728.00
申报金额: ¥60,000.00
差异金额: ¥57,728.00
差异率: 49.04%

预期结果:

风险等级: MEDIUM
风险评分: 60-75分
风险类型: 分批申报未完

触发条件:

差异率 (49.04%) < 50% (严重风险阈值)
但是 > 30% (高风险阈值)，可能被评为HIGH
差异金额 (57,728元) > 50,000元 (高风险阈值)

🔬 API测试方法

方法1: 使用cURL测试

# 测试场景1: 严重漏报
curl -X POST http://localhost:8000/api/v1/risk-detection/detect \\
  -H "Content-Type: application/json" \\
  -d '{
    "streamer_id": "TEST_001",
    "period": "2024-01",
    "comparison_type": "monthly"
  }'

# 测试场景2: 高风险
curl -X POST http://localhost:8000/api/v1/risk-detection/detect \\
  -H "Content-Type: application/json" \\
  -d '{
    "streamer_id": "TEST_002",
    "period": "2024-01",
    "comparison_type": "monthly"
  }'

# 测试场景3: 中风险
curl -X POST http://localhost:8000/api/v1/risk-detection/detect \\
  -H "Content-Type: application/json" \\
  -d '{
    "streamer_id": "TEST_003",
    "period": "2024-01",
    "comparison_type": "monthly"
  }'

# 测试场景4: 低风险
curl -X POST http://localhost:8000/api/v1/risk-detection/detect \\
  -H "Content-Type: application/json" \\
  -d '{
    "streamer_id": "TEST_004",
    "period": "2024-01",
    "comparison_type": "monthly"
  }'

# 测试场景5: 正常
curl -X POST http://localhost:8000/api/v1/risk-detection/detect \\
  -H "Content-Type: application/json" \\
  -d '{
    "streamer_id": "TEST_005",
    "period": "2024-01",
    "comparison_type": "monthly"
  }'

# 测试场景6: 完全未申报
curl -X POST http://localhost:8000/api/v1/risk-detection/detect \\
  -H "Content-Type: application/json" \\
  -d '{
    "streamer_id": "TEST_006",
    "period": "2024-01",
    "comparison_type": "monthly"
  }'

# 测试场景7: 多平台收入
curl -X POST http://localhost:8000/api/v1/risk-detection/detect \\
  -H "Content-Type: application/json" \\
  -d '{
    "streamer_id": "TEST_007",
    "period": "2024-01",
    "comparison_type": "monthly"
  }'

# 测试场景8: 分批申报
curl -X POST http://localhost:8000/api/v1/risk-detection/detect \\
  -H "Content-Type: application/json" \\
  -d '{
    "streamer_id": "TEST_008",
    "period": "2024-01",
    "comparison_type": "monthly"
  }'

方法2: 使用Python脚本测试

import requests
import json

API_BASE = "http://localhost:8000/api/v1"

# 测试所有场景
test_cases = [
    {"streamer_id": "TEST_001", "name": "严重漏报"},
    {"streamer_id": "TEST_002", "name": "高风险"},
    {"streamer_id": "TEST_003", "name": "中风险"},
    {"streamer_id": "TEST_004", "name": "低风险"},
    {"streamer_id": "TEST_005", "name": "正常"},
    {"streamer_id": "TEST_006", "name": "完全未申报"},
    {"streamer_id": "TEST_007", "name": "多平台收入"},
    {"streamer_id": "TEST_008", "name": "分批申报"},
]

for test_case in test_cases:
    response = requests.post(
        f"{API_BASE}/risk-detection/detect",
        json={
            "streamer_id": test_case["streamer_id"],
            "period": "2024-01",
            "comparison_type": "monthly"
        }
    )
    result = response.json()
    print(f"\n{test_case['name']} ({test_case['streamer_id']}):")
    print(f"  风险等级: {result.get('risk_level')}")
    print(f"  风险评分: {result.get('risk_score')}")

方法3: 使用前端界面测试

访问前端页面: http://localhost:3000/risk-detection/execute
选择算法: 收入完整性检测
输入主播ID: TEST_001 (或其他测试ID)
选择期间: 2024-01
点击"开始检测"

📊 预期结果对照表

场景	主播ID	预期等级	预期评分	差异率	差异金额
场景1	TEST_001	CRITICAL	90-100	78.04%	¥355,375
场景2	TEST_002	HIGH	75-90	39.68%	¥118,428
场景3	TEST_003	MEDIUM	50-75	13.45%	¥13,213
场景4	TEST_004	LOW	25-50	1.66%	¥792
场景5	TEST_005	LOW	0-25	-1.85%	-¥1,779
场景6	TEST_006	CRITICAL	95-100	100.00%	¥748,729
场景7	TEST_007	HIGH	80-90	66.72%	¥100,251
场景8	TEST_008	MEDIUM	60-75	49.04%	¥57,728

🎓 算法验证要点

1. 数据获取验证

正确获取主播信息
正确获取充值数据
正确获取申报数据
正确获取分成协议

2. 差异计算验证

差异金额 = 充值总额 - 申报金额
差异率 = 差异金额 / 充值总额 × 100%
负差异率处理（申报超额）

3. 风险评级验证

CRITICAL: 差异率 > 50% 或差异金额 > 10万
HIGH: 差异率 > 30% 或差异金额 > 5万
MEDIUM: 差异率 > 10% 或差异金额 > 1万
LOW: 差异率 > 5% 或差异金额 > 5000
NONE: 差异率 <= 5% 且差异金额 <= 5000

4. 证据链验证

收入汇总证据
申报汇总证据
差异分析证据
风险详情证据

5. 边界条件测试

零申报处理
超额申报处理
大额差异处理
小额差异处理

🔍 问题排查

问题1: 找不到主播信息

症状: 返回错误 "找不到主播信息" 原因: 数据库中无对应主播数据解决: 检查streamers.json中的数据是否已导入

问题2: 风险等级不匹配

症状: 实际风险等级与预期不符原因: 阈值配置或计算逻辑问题解决: 检查阈值配置和差异计算公式

问题3: 数据为空

症状: 充值或申报数据为空原因: 参数错误或期间不匹配解决: 检查期间格式(YYYY-MM)是否正确

📝 测试报告模板

# 收入完整性检测算法测试报告

## 测试环境
- 测试时间: 2025-11-28
- 算法版本: v1.0
- 测试数据: 8个场景

## 测试结果

### 场景1: 严重漏报 (TEST_001)
- 输入: TEST_001, 2024-01
- 预期: CRITICAL (90-100分)
- 实际: [实际结果]
- 结果: ✓ 通过 / ✗ 失败

### 场景2: 高风险 (TEST_002)
- 输入: TEST_002, 2024-01
- 预期: HIGH (75-90分)
- 实际: [实际结果]
- 结果: ✓ 通过 / ✗ 失败

... (其他场景)

## 总结
- 通过率: X/8 (XX%)
- 问题数量: X个
- 建议: [改进建议]

11 KiB Raw Permalink Blame History Unescape Escape

收入完整性检测算法测试指南

📋 测试概览

数据统计

🎯 测试场景详细说明

场景1: 严重漏报场景 (CRITICAL)

场景2: 高风险场景 (HIGH)

场景3: 中风险场景 (MEDIUM)

场景4: 低风险场景 (LOW)

场景5: 正常场景 (LOW)

场景6: 完全未申报场景 (CRITICAL)

场景7: 多平台收入场景 (HIGH)

场景8: 分批申报场景 (MEDIUM)

🔬 API测试方法

方法1: 使用cURL测试

方法2: 使用Python脚本测试

方法3: 使用前端界面测试

📊 预期结果对照表

🎓 算法验证要点

1. 数据获取验证

2. 差异计算验证

3. 风险评级验证

4. 证据链验证

5. 边界条件测试

🔍 问题排查

问题1: 找不到主播信息

问题2: 风险等级不匹配

问题3: 数据为空

📝 测试报告模板

📚 相关文档

11 KiB

Raw Permalink Blame History