shelllet
diff --git a/‎assets/txt/img_rot180_demo.jpg‎
92.1 KB b/‎assets/txt/img_rot180_demo.jpg‎
92.1 KB
diff --git a/‎docx/CHANGELOG.md‎
Lines changed: 21 additions & 4 deletions b/‎docx/CHANGELOG.md‎
Lines changed: 21 additions & 4 deletions
diff --git a/‎docx/_sidebar.md‎
Lines changed: 12 additions & 7 deletions b/‎docx/_sidebar.md‎
Lines changed: 12 additions & 7 deletions
diff --git a/‎docx/actions/ai/DocumentOrientation.md‎
Lines changed: 25 additions & 0 deletions b/‎docx/actions/ai/DocumentOrientation.md‎
Lines changed: 25 additions & 0 deletions
diff --git a/‎docx/actions/ai/PaddleOCR.md‎
Lines changed: 0 additions & 40 deletions b/‎docx/actions/ai/PaddleOCR.md‎
Lines changed: 0 additions & 40 deletions
diff --git a/‎docx/actions/ai/TextDetection.md‎
Lines changed: 21 additions & 17 deletions b/‎docx/actions/ai/TextDetection.md‎
Lines changed: 21 additions & 17 deletions
diff --git a/‎docx/actions/ai/TesseractOCR.md‎ ‎docx/actions/ai/TextExtract.md‎docx/actions/ai/TesseractOCR.md renamed to docx/actions/ai/TextExtract.md
Lines changed: 3 additions & 3 deletions b/‎docx/actions/ai/TesseractOCR.md‎ ‎docx/actions/ai/TextExtract.md‎docx/actions/ai/TesseractOCR.md renamed to docx/actions/ai/TextExtract.md
Lines changed: 3 additions & 3 deletions
diff --git a/‎docx/actions/ai/TextRecognition.md‎
Lines changed: 27 additions & 0 deletions b/‎docx/actions/ai/TextRecognition.md‎
Lines changed: 27 additions & 0 deletions
diff --git a/‎docx/actions/ai/TextUnwarping.md‎
Lines changed: 24 additions & 0 deletions b/‎docx/actions/ai/TextUnwarping.md‎
Lines changed: 24 additions & 0 deletions
diff --git a/‎docx/actions/ai/TextlineOrientation.md‎
Lines changed: 23 additions & 0 deletions b/‎docx/actions/ai/TextlineOrientation.md‎
Lines changed: 23 additions & 0 deletions
@@ -1,4 +1,21 @@
-# [0.46.0](https://github.com/shelllet/winui/compare/main...dev) (2025-07-22)
+# [0.47.0](https://github.com/shelllet/winui/compare/main...dev) (2025-09-22)
+
+### Changed：
+1. 优化文字识别动作，文字识别结果已经更改为从上至下的顺序。
+2. 支持鼠标右键拖动动作视图。
+3. 修复另存时，项目未进入快速启动列表中。
+4. 关机动作更新为 [SuspendSystem](./actions/system/SuspendSystem.md)， 并且支持休眠。
+5. 支持运行当前的工作流。
+6. [退出流程] 动作更名，参考： [退出流程](./actions/control/Exit.md)。
+7. 增加 [域名查询](./actions/control/DomainQuery.md) 动作， 用于操持流程不退出。
+
+### Note
+
+1. 使用管理员权限运行 *小友+*, 无法显示 *动作* 的拖动效果（已知问题）。
+2。该版本由于内置了一些文字处理相关的模型，安装包大小已经超过 `300M`。
+3. 64位下载(x64)：邀请你加入群组:小友+ http://yun.139.com/m/#/invitation?type=1&msgId=1227933999795726207
+
+## [0.46.0](https://github.com/shelllet/winui/compare/main...dev) (2025-07-22)
 
 ### Changed：
 1. [枚举窗口](./actions/window/EnumWindows.md) 动作不再支持异步处理。
@@ -10,7 +27,7 @@
 ### Note
 
 1. 使用管理员权限运行 *小友+*, 无法显示 *动作* 的拖动效果（已知问题）。
-3. 64位下载(x64)：邀请你加入群组:小友+ http://yun.139.com/m/#/invitation?type=1&msgId=1227933999795726207
+2. 64位下载(x64)：邀请你加入群组:小友+ http://yun.139.com/m/#/invitation?type=1&msgId=1227933999795726207
 
 ## [0.45.0](https://github.com/shelllet/winui/compare/main...dev) (2025-06-13)
 
@@ -31,8 +48,8 @@
 
 ### Changed：
 1. [相机类型](./actions/type/TypeCamera.md) 动作支持工业 USB3/GIGE 接口相机，比如海康相机。
-2. 更新 [文字识别](./actions/ai/PaddleOCR.md) 动作，运行加载其它语言模型，用来识别中英文以外的文字。
-3. 更新 [文字识别（Tesseract）](./actions/ai/TesseractOCR.md) 动作, 支持基于 *Tesseract* （常用来识别特殊字体）的文字识别。
+2. 更新 [文字识别](./actions/ai/TextRecognition.md) 动作，运行加载其它语言模型，用来识别中英文以外的文字。
+3. 更新 [文字识别（Tesseract）](./actions/ai/TextExtract.md) 动作, 支持基于 *Tesseract* （常用来识别特殊字体）的文字识别。
 4. 添加动作菜单*缓存对象*。 用来解决 某些动作反复执行时，由于内置对象的初始化比较耗，导致不必要的时间开销。
 5. 动作支持借助脚本更新运行时参数，详情参考动作说明。 
 6. 修复导入其它流程崩溃问题。
 
@@ -15,7 +15,7 @@
     - [变量](./introduction/workflow/variable.md)
     - [资源](./introduction/workflow/resources.md)
     - [动作](./introduction/workflow/action.md)
-    - [流程操作技巧](./introduction/workflow/skill.md)
+    - [内置功能](./introduction/workflow/features.md)
   - 浏览器
     - [Web 定位策略](./introduction/webdriver/locators.md)
     - [WebDriver 下载](./introduction/webdriver/download.md)
@@ -41,7 +41,7 @@
       - [打开应用](./actions/system/OpenApplication.md)
       - [打开文件](./actions/system/LaunchFile.md)
       - [打开链接](./actions/system/OpenUrl.md)
-      - [退出系统](./actions/system/ExitWindows.md)
+      - [退出系统](./actions/system/SuspendSystem.md)
       - [关闭句柄](./actions/system/CloseHandle.md)
       - [检测进程](./actions/system/ExistProcess.md)
       - [终止进程](./actions/system/KillProcess.md)
@@ -148,11 +148,14 @@
     - 深度学习
       - [目标分类](./actions/ai/ImageClassification.md)
       - [对象检测](./actions/ai/ObjectDetection.md)
-      - [文字识别](./actions/ai/PaddleOCR.md)
-      - [文本块检测](./actions/ai/TextDetection.md)
+      - [文字图像方向矫正](./actions/ai/DocumentOrientation.md)
+      - [文字图像矫正](./actions/ai/TextUnwarping.md)
+      - [文字区域检测](./actions/ai/TextDetection.md)
+      - [文字角度纠正](./actions/ai/TextlineOrientation.md)
+      - [文字识别](./actions/ai/TextRecognition.md)
       - [二维码识别](./actions/ai/QRCode.md)
       - [条码识别](./actions/ai/BarcodeDetector.md)
-      - [文字识别（Tesseract）](./actions/ai/TesseractOCR.md)
+      - [文本提取](./actions/ai/TextExtract.md)
     - 媒体
       - [窗口截图](./actions/media/CaptureWindow.md)
       - [全屏截图](./actions/media/CaptureScreen.md)
@@ -171,6 +174,8 @@
       - [数据发送](./actions/network/NetworkSend.md)
       - [数据接收](./actions/network/NetworkReceive.md)
       - [服务连接](./actions/network/NetworkConnect.md)
+      - [域名查询](./actions/network/DomainQuery.md)
+
     - 统计分析
       - [加载文档](./actions/pandas/LoadDocument.md)
       - [查询](./actions/pandas/DataFrameQuery.md)
@@ -241,7 +246,7 @@
       - [调用](./actions/control/Invoke.md)
       - [停止循环](./actions/control/Break.md)
       - [脚本](./actions/control/Code.md)
-      - [退出流程](./actions/control/Quit.md)
+      - [退出流程](./actions/control/Exit.md)
       - [表达式](./actions/control/CodeExpression.md)
       - [引用动作](./actions/control/ActionAlias.md)
       - [引用动作（名称）](./actions/control/NameAlias.md)
@@ -351,7 +356,7 @@
     - [FeatureAlgorithm](./enums/FeatureAlgorithm.md)
     - [WindowSortDirection](./enums/WindowSortDirection.md)
     - [FileExtension](./enums/FileExtension.md)
-    - [ExitWindowsOption](./enums/ExitWindowsOption.md)
+    - [SuspendStateOption](./enums/SuspendStateOption.md)
     - [WebKey](./enums/WebKey.md)
     - [WebLocated](./enums/WebLocated.md)
     - [ModuleOption](./enums/ModuleOption.md)
 
@@ -0,0 +1,25 @@
+# 文字图像方向矫正 
+
+将文档图像的方向区分出来，并使用后处理将其矫正。在诸如文档扫描、证照拍摄等过程中，有时为了拍摄更清晰，会将拍摄设备进行旋转，导致得到的图片也是不同方向的。此时，标准的OCR流程无法很好地应对这些数据。利用图像分类技术，可以预先判断含文字区域的文档或证件的方向，并将其进行方向调整，从而提高 OCR 处理的准确性。
+
+![DocumentOrientation](./images/09.png ':size=90%')
+
+## 子流程
+> 不支持
+
+## 运行参数
+
+* 图像 <sup>1</sup>
+> 包含文字的图片。
+
+
+## 输出 
+
+> 参考 [Image](./types/Image.md)；
+
+### 其它
+
+示例 https://github.com/shelllet/WinUi/blob/main/dnn/TextRecognition.simple
+
+
+
@@ -1,36 +1,40 @@
-# 文本块检测
-检测图像上的文本区域。
+# 文字区域检测 
+在图像中定位和标记出包含文本的区域。该模块的性能直接影响到整个OCR系统的准确性和效率。
 
-![TextDetection](./images/04.png ':size=90%')
+![TextDetection](./images/03.png ':size=90%')
 
 ## 子流程
 > 不支持
 
-
 ## 运行参数
 
-* 图像
-> 包含文字的图像
+* 图像 <sup>1</sup>
+> 包含文字的图片。
 
-* 文本框评分
-> 计算文本框的得分，分值太低，则不认为是有效的文本框。
+* 图像边长限制类型 <sup>2</sup>
+> [短边] 表示确保图片最短边不小于 [文本检测的图片边长限制]，[长边] 表示确保图片最长边不大于 [文本检测的图片边长限制]。
 
-## 输出
+* 图片边长限制 <sup>3</sup>
+> 对于文本密集的大图像，如果想要更准确的识别，应该选择更大的尺寸。此参数与[文本检测的图像边长限制类型]配合使用。通常，[长边]的最大值适用于图像较大且文本密集的场景，[短边]的最小值适用于图像较小且文本密集的文档场景。
 
-> 检测结果，参考：[DetectionResults](./types/DetectionResult.md)。
-## 脚本调用
+* 文本检测像素阈值 <sup>4</sup>
+> 在输出概率图中，只有得分大于阈值的像素才被视为文本像素，取值范围为 `0 ~ 1`。
 
-```python
-import simple;
+* 文本检测框阈值 <sup>5</sup>
 
-```
+> 当检测结果边框内所有像素的平均得分大于阈值时，该结果将被视为文本区域，取值范围为 `0` 至 `1`。如果出现漏检，可以适当降低此值。
+
+* 文本检测去裁剪比例 <sup>6</sup>
+>使用此方法扩展文本区域。值越大，扩展区域越大。
 
-### 其它
 
-示例 https://github.com/shelllet/WinUi/blob/main/dnn/TextDetection.simple
+## 输出 
 
+> 参考 [`DetectionResults`](./types/DetectionResult.md)。
+
+### 其它
 
+示例 https://github.com/shelllet/WinUi/blob/main/dnn/TextRecognition.simple
 
 
 
-!> 文字检测模型训练：https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.6/doc/doc_ch/detection.md
 
@@ -1,11 +1,11 @@
-# 文字识别（Tesseract）
+# TextExtract
 基于 Tesseract OCR 的一款开源的光学字符识别引擎。能够识别多种语言的文字，包括但不限于英语、中文、法语、德语等。
 
 * 支持多种语言：Tesseract 能够识别多种语言的文字，包括但不限于英语、中文、法语、德语等。通过训练数据的扩展，其语言识别能力还在不断增强。
 * 高识别准确率：在经过大量数据训练和优化后，对于清晰的文档图像，Tesseract 可以达到较高的识别准确率。它能够处理多种字体、字号和排版格式的文字，对噪声和图像变形有一定的鲁棒性。
 * 可定制性强：用户可以根据自己的需求对 Tesseract 进行定制，例如训练自己的字库模型，以提高对特定领域或特殊字体的识别效果。此外，还可以调*整各种参数来优化识别过程，适应不同的应用场景。
 
-![TesseractOCR](./images/07.png ':size=90%')
+![TextExtract](./images/07.png ':size=90%')
 
 ## 子流程
 > 不支持
@@ -30,4 +30,4 @@
 
 ### 其它
 
-示例 https://github.com/shelllet/WinUi/blob/main/dnn/PaddleOCR.simple
+示例 https://github.com/shelllet/WinUi/blob/main/dnn/TextRecognition.simple
@@ -0,0 +1,27 @@
+# 文字识别 
+识别图像中的中文/英文文字。
+
+![TextRecognition](./images/08.png ':size=90%')
+
+## 子流程
+> 不支持
+
+## 运行参数
+
+* 图像 <sup>1</sup>
+> 包含文字的图片。
+
+* 置信度 <sup>2/sup>
+> 文本检测完成后，对文本框内的文字进行文本识别，得分大于该阈值的文本结果将被保留。取值范围为 `0 ~ 1`。
+
+
+## 输出 
+
+> 参考 [`RecognitionResults`](./types/RecognitionResult.md)。
+
+### 其它
+
+示例 https://github.com/shelllet/WinUi/blob/main/dnn/TextRecognition.simple
+
+
+
@@ -0,0 +1,24 @@
+# 文字图像矫正 
+针对图像进行几何变换，以纠正图像中的文档扭曲、倾斜、透视变形等问题，以供后续的文本识别进行更加准确。
+
+![TextUnwarping](./images/11.png ':size=90%')
+
+## 子流程
+> 不支持
+
+## 运行参数
+
+* 图像 <sup>1</sup>
+> 包含文字的图片。
+
+
+## 输出 
+
+> 参考 [Image](./types/Image.md)。
+
+### 其它
+
+示例 https://github.com/shelllet/WinUi/blob/main/dnn/TextRecognition.simple
+
+
+
@@ -0,0 +1,23 @@
+# 文字角度纠正 
+角度分类器，默认识别：0°、90° 、270°。 如果使用，则可识别旋转180°的图片。如果文本没有旋转180°，为了性能，请不要使用该选项。其它文本旋转角度无法准确识别。
+
+![TextlineOrientation](./images/10.png ':size=90%')
+
+## 子流程
+> 不支持
+
+## 运行参数
+
+* 图像 <sup>1</sup>
+> 包含文字的图片，也可以是 [TextDetection](./actions/ai/TextDetection.md) 的结果 。
+
+## 输出 
+
+> 如果参数 `1` 是图像, 参考 [Image](./types/Image.md)；如果参数 `1` 是 [`DetectionResults`](./types/DetectionResult.md)， 参考 [DetectionResults](./types/DetectionResult.md)。
+
+### 其它
+
+示例 https://github.com/shelllet/WinUi/blob/main/dnn/TextRecognition.simple
+
+
+