From e3f4cf3bacac6eda31ddea6aaf70ebb883788817 Mon Sep 17 00:00:00 2001
From: Administrator <admin@example.com>
Date: 星期三, 28 五月 2025 17:38:07 +0800
Subject: [PATCH] L2成交大单解析

---
 data_parser/transaction_big_order_parser.py |   59 +++++++++++++++++++++++++++++++++++++++++------------------
 1 files changed, 41 insertions(+), 18 deletions(-)

diff --git a/data_parser/transaction_big_order_parser.py b/data_parser/transaction_big_order_parser.py
index aad957a..84dae46 100644
--- a/data_parser/transaction_big_order_parser.py
+++ b/data_parser/transaction_big_order_parser.py
@@ -201,7 +201,7 @@
 __combined_df_cache = {}
 
 
-def extract_big_order_of_all(dir_path):
+def extract_big_order_of_all(dir_path, process_count=4):
     combined_path = os.path.join(dir_path, 'combined.csv')
     if not os.path.exists(combined_path):
         print_log("鎷兼帴鏁版嵁涓嶅瓨鍦�")
@@ -211,15 +211,25 @@
     for code in codes:
         extract_big_order_of_code(dir_path, code)
 
+    combined_path = os.path.join(dir_path, 'combined.csv')
+    if not os.path.exists(combined_path):
+        print_log("鎷兼帴鏁版嵁涓嶅瓨鍦�")
+        return
+    output_path = os.path.join(dir_path, f"big_buy_{code}.csv")
+    if os.path.exists(output_path):
+        print_log("璺緞宸插瓨鍦�:", output_path)
+        return
+    df = __combined_df_cache.get(combined_path, None)
+    if df is None:
+        df = pd.read_csv(combined_path)
+        __combined_df_cache[combined_path] = df
+    args = [(code, df) for code in codes]
+    # 鏂板啓娉�
+    with Pool(processes=process_count) as pool:
+        pool.map(__extract_big_order_of_code, args)
 
-def extract_big_order_of_code(dir_path, code):
-    """
-    鎻愬彇浠ｇ爜鐨勫ぇ鍗�
-    @param dir_path: 鏁版嵁鐩綍
-    @param code: 涓虹┖琛ㄧず瀵煎嚭鍏ㄩ儴
-    @return:
-    """
 
+def __extract_big_order_of_code(args):
     def first_last(group):
         """
             鑾峰彇绗竴鏉℃暟鎹笌鏈�鍚庝竴鏉�
@@ -237,18 +247,11 @@
             'StartPrice': group['StartPrice'].iloc[0]
         })
 
-    combined_path = os.path.join(dir_path, 'combined.csv')
-    if not os.path.exists(combined_path):
-        print_log("鎷兼帴鏁版嵁涓嶅瓨鍦�")
-        return
+    dir_path, code, df = args[0], args[1], args[2]
     output_path = os.path.join(dir_path, f"big_buy_{code}.csv")
     if os.path.exists(output_path):
         print_log("璺緞宸插瓨鍦�:", output_path)
         return
-    df = __combined_df_cache.get(combined_path, None)
-    if df is None:
-        df = pd.read_csv(combined_path)
-        __combined_df_cache[combined_path] = df
     df_copy = df.copy()
     if code:
         df_copy = df_copy[df_copy["SecurityID"] == int(code)]
@@ -264,6 +267,26 @@
     # 閬嶅巻鍐呭
     grouped_result.to_csv(output_path, index=False)
     print_log(f"[{tool.get_now_time_str()}]淇濆瓨鎴愬姛锛岃矾寰勶細{output_path}")
+
+
+def extract_big_order_of_code(dir_path, code):
+    """
+    鎻愬彇浠ｇ爜鐨勫ぇ鍗�
+    @param dir_path: 鏁版嵁鐩綍
+    @param code: 涓虹┖琛ㄧず瀵煎嚭鍏ㄩ儴
+    @return:
+    """
+
+    combined_path = os.path.join(dir_path, 'combined.csv')
+    if not os.path.exists(combined_path):
+        print_log("鎷兼帴鏁版嵁涓嶅瓨鍦�")
+        return
+
+    df = __combined_df_cache.get(combined_path, None)
+    if df is None:
+        df = pd.read_csv(combined_path)
+        __combined_df_cache[combined_path] = df
+    __extract_big_order_of_code((dir_path, code, df))
 
 
 def extract_big_order_codes(dir_path):
@@ -289,9 +312,9 @@
 
 
 if __name__ == "__main__":
-    log(1,2,3)
+    print_log(1, 2, 3)
     # pre_process_transactions("E:/娴嬭瘯鏁版嵁/Transaction_Test.csv")
     # pre_process_ngtsticks("E:/娴嬭瘯鏁版嵁/NGTSTick_Test.csv")
     # concat_pre_transactions("E:/娴嬭瘯鏁版嵁/Transaction_Test")
     # extract_big_order_codes("E:/娴嬭瘯鏁版嵁/Transaction_Test")
-    extract_big_order_of_code("E:/娴嬭瘯鏁版嵁/Transaction_Test")
+    extract_big_order_of_all("E:/娴嬭瘯鏁版嵁/Transaction_Test")

--
Gitblit v1.8.0