类 TextSplitter


  • public class TextSplitter
    extends java.lang.Object
    • 方法概要

      所有方法 静态方法 具体方法 
      修饰符和类型 方法 说明
      static java.util.List<java.lang.String> spiltText​(java.lang.String str, int spiltIndex)
      将长文本分割为短句,每间隔spiltIndex个字符进行一次分割
      static java.util.List<java.lang.String> spiltTextByPunctuation​(java.lang.String str, int spiltUnit)
      将长文本分割为短句,每超过 spiltUnit 个字符向后寻找标点符号进行断句
      • 从类继承的方法 java.lang.Object

        clone, equals, finalize, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait
    • 构造器详细资料

      • TextSplitter

        public TextSplitter()
    • 方法详细资料

      • spiltText

        public static java.util.List<java.lang.String> spiltText​(java.lang.String str,
                                                                 int spiltIndex)
        将长文本分割为短句,每间隔spiltIndex个字符进行一次分割
        参数:
        str - 文本
        spiltIndex - 切割点
        返回:
        切割的文本集合
      • spiltTextByPunctuation

        public static java.util.List<java.lang.String> spiltTextByPunctuation​(java.lang.String str,
                                                                              int spiltUnit)
        将长文本分割为短句,每超过 spiltUnit 个字符向后寻找标点符号进行断句
        参数:
        str - 文本
        spiltUnit - 断句跨度单位
        返回:
        返回短句集合