This commit is contained in:
mozzie 2024-03-28 12:32:12 +08:00
parent b008d92b71
commit 92a7d900a9
14 changed files with 470 additions and 460 deletions

File diff suppressed because one or more lines are too long

View File

@ -197,7 +197,7 @@
<span>RAG知识库召回率</span> <span>RAG知识库召回率</span>
</div> </div>
<p>通用的RAG方案的召回率不一定召回率越高越好对于准确性也需要考虑通用的召回率大概在70%不论是dify还是fastgpt对于生产场景要求起码到90%的水平 <p>通用的RAG方案的召回率不一定召回率越高越好对于准确性也需要考虑通用的召回率大概在70%不论是dify还是fastgpt对于生产场景要求起码到90%的水平
意图分类类似 xxx企业的董事长是...</p> 意图分类提问的内容很短、缩写的情况...</p>
</div> </div>
</a> </a>
</li> </li>
@ -347,55 +347,6 @@ typedef struct&amp;#123;
</a> </a>
</li> </li>
<li>
<a class="timeline-item" href="/posts/58551/">
<div class="timeline-info">
<cosy-tooltip><span slot="content">完成</span><cosy-icon size="sm"><svg xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" viewBox="0 0 24 24"><g fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round"><circle cx="12" cy="12" r="9"></circle><path d="M9 12l2 2l4-4"></path></g></svg></cosy-icon></cosy-tooltip>
<span>03-15 14:44:57</span>
</div>
<div class="timeline-marker"></div>
<div class="timeline-content">
<div class="timeline-title ellipsis">
<span>短视频账号起号逻辑</span>
</div>
<p>抖音流量池
级别
曝光次数
播放量范围
初级流量池
冷启动
0~500
二次曝光
3K~5K
三次曝光
1W~2W
四次曝光(人工复审)
10W~15W
中级流量池
五...</p>
</div>
</a>
</li>
<li> <li>
<a class="timeline-item" href="/posts/8323/"> <a class="timeline-item" href="/posts/8323/">
<div class="timeline-info"> <div class="timeline-info">
@ -516,6 +467,55 @@ typedef struct&amp;#123;
</a> </a>
</li> </li>
<li>
<a class="timeline-item" href="/posts/58551/">
<div class="timeline-info">
<cosy-tooltip><span slot="content">完成</span><cosy-icon size="sm"><svg xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" viewBox="0 0 24 24"><g fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round"><circle cx="12" cy="12" r="9"></circle><path d="M9 12l2 2l4-4"></path></g></svg></cosy-icon></cosy-tooltip>
<span>03-15 14:44:57</span>
</div>
<div class="timeline-marker"></div>
<div class="timeline-content">
<div class="timeline-title ellipsis">
<span>短视频账号起号逻辑</span>
</div>
<p>抖音流量池
级别
曝光次数
播放量范围
初级流量池
冷启动
0~500
二次曝光
3K~5K
三次曝光
1W~2W
四次曝光(人工复审)
10W~15W
中级流量池
五...</p>
</div>
</a>
</li>
<li> <li>
<a class="timeline-item" href="/posts/31204/"> <a class="timeline-item" href="/posts/31204/">
<div class="timeline-info"> <div class="timeline-info">

View File

@ -197,7 +197,7 @@
<span>RAG知识库召回率</span> <span>RAG知识库召回率</span>
</div> </div>
<p>通用的RAG方案的召回率不一定召回率越高越好对于准确性也需要考虑通用的召回率大概在70%不论是dify还是fastgpt对于生产场景要求起码到90%的水平 <p>通用的RAG方案的召回率不一定召回率越高越好对于准确性也需要考虑通用的召回率大概在70%不论是dify还是fastgpt对于生产场景要求起码到90%的水平
意图分类类似 xxx企业的董事长是...</p> 意图分类提问的内容很短、缩写的情况...</p>
</div> </div>
</a> </a>
</li> </li>
@ -347,55 +347,6 @@ typedef struct&amp;#123;
</a> </a>
</li> </li>
<li>
<a class="timeline-item" href="/posts/58551/">
<div class="timeline-info">
<cosy-tooltip><span slot="content">完成</span><cosy-icon size="sm"><svg xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" viewBox="0 0 24 24"><g fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round"><circle cx="12" cy="12" r="9"></circle><path d="M9 12l2 2l4-4"></path></g></svg></cosy-icon></cosy-tooltip>
<span>03-15 14:44:57</span>
</div>
<div class="timeline-marker"></div>
<div class="timeline-content">
<div class="timeline-title ellipsis">
<span>短视频账号起号逻辑</span>
</div>
<p>抖音流量池
级别
曝光次数
播放量范围
初级流量池
冷启动
0~500
二次曝光
3K~5K
三次曝光
1W~2W
四次曝光(人工复审)
10W~15W
中级流量池
五...</p>
</div>
</a>
</li>
<li> <li>
<a class="timeline-item" href="/posts/8323/"> <a class="timeline-item" href="/posts/8323/">
<div class="timeline-info"> <div class="timeline-info">
@ -516,6 +467,55 @@ typedef struct&amp;#123;
</a> </a>
</li> </li>
<li>
<a class="timeline-item" href="/posts/58551/">
<div class="timeline-info">
<cosy-tooltip><span slot="content">完成</span><cosy-icon size="sm"><svg xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" viewBox="0 0 24 24"><g fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round"><circle cx="12" cy="12" r="9"></circle><path d="M9 12l2 2l4-4"></path></g></svg></cosy-icon></cosy-tooltip>
<span>03-15 14:44:57</span>
</div>
<div class="timeline-marker"></div>
<div class="timeline-content">
<div class="timeline-title ellipsis">
<span>短视频账号起号逻辑</span>
</div>
<p>抖音流量池
级别
曝光次数
播放量范围
初级流量池
冷启动
0~500
二次曝光
3K~5K
三次曝光
1W~2W
四次曝光(人工复审)
10W~15W
中级流量池
五...</p>
</div>
</a>
</li>
<li> <li>
<a class="timeline-item" href="/posts/31204/"> <a class="timeline-item" href="/posts/31204/">
<div class="timeline-info"> <div class="timeline-info">

View File

@ -197,7 +197,7 @@
<span>RAG知识库召回率</span> <span>RAG知识库召回率</span>
</div> </div>
<p>通用的RAG方案的召回率不一定召回率越高越好对于准确性也需要考虑通用的召回率大概在70%不论是dify还是fastgpt对于生产场景要求起码到90%的水平 <p>通用的RAG方案的召回率不一定召回率越高越好对于准确性也需要考虑通用的召回率大概在70%不论是dify还是fastgpt对于生产场景要求起码到90%的水平
意图分类类似 xxx企业的董事长是...</p> 意图分类提问的内容很短、缩写的情况...</p>
</div> </div>
</a> </a>
</li> </li>
@ -347,55 +347,6 @@ typedef struct&amp;#123;
</a> </a>
</li> </li>
<li>
<a class="timeline-item" href="/posts/58551/">
<div class="timeline-info">
<cosy-tooltip><span slot="content">完成</span><cosy-icon size="sm"><svg xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" viewBox="0 0 24 24"><g fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round"><circle cx="12" cy="12" r="9"></circle><path d="M9 12l2 2l4-4"></path></g></svg></cosy-icon></cosy-tooltip>
<span>03-15 14:44:57</span>
</div>
<div class="timeline-marker"></div>
<div class="timeline-content">
<div class="timeline-title ellipsis">
<span>短视频账号起号逻辑</span>
</div>
<p>抖音流量池
级别
曝光次数
播放量范围
初级流量池
冷启动
0~500
二次曝光
3K~5K
三次曝光
1W~2W
四次曝光(人工复审)
10W~15W
中级流量池
五...</p>
</div>
</a>
</li>
<li> <li>
<a class="timeline-item" href="/posts/8323/"> <a class="timeline-item" href="/posts/8323/">
<div class="timeline-info"> <div class="timeline-info">
@ -516,6 +467,55 @@ typedef struct&amp;#123;
</a> </a>
</li> </li>
<li>
<a class="timeline-item" href="/posts/58551/">
<div class="timeline-info">
<cosy-tooltip><span slot="content">完成</span><cosy-icon size="sm"><svg xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" viewBox="0 0 24 24"><g fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round"><circle cx="12" cy="12" r="9"></circle><path d="M9 12l2 2l4-4"></path></g></svg></cosy-icon></cosy-tooltip>
<span>03-15 14:44:57</span>
</div>
<div class="timeline-marker"></div>
<div class="timeline-content">
<div class="timeline-title ellipsis">
<span>短视频账号起号逻辑</span>
</div>
<p>抖音流量池
级别
曝光次数
播放量范围
初级流量池
冷启动
0~500
二次曝光
3K~5K
三次曝光
1W~2W
四次曝光(人工复审)
10W~15W
中级流量池
五...</p>
</div>
</a>
</li>
<li> <li>
<a class="timeline-item" href="/posts/31204/"> <a class="timeline-item" href="/posts/31204/">
<div class="timeline-info"> <div class="timeline-info">

View File

@ -197,7 +197,7 @@
<span>RAG知识库召回率</span> <span>RAG知识库召回率</span>
</div> </div>
<p>通用的RAG方案的召回率不一定召回率越高越好对于准确性也需要考虑通用的召回率大概在70%不论是dify还是fastgpt对于生产场景要求起码到90%的水平 <p>通用的RAG方案的召回率不一定召回率越高越好对于准确性也需要考虑通用的召回率大概在70%不论是dify还是fastgpt对于生产场景要求起码到90%的水平
意图分类类似 xxx企业的董事长是...</p> 意图分类提问的内容很短、缩写的情况...</p>
</div> </div>
</a> </a>
</li> </li>
@ -347,55 +347,6 @@ typedef struct&amp;#123;
</a> </a>
</li> </li>
<li>
<a class="timeline-item" href="/posts/58551/">
<div class="timeline-info">
<cosy-tooltip><span slot="content">完成</span><cosy-icon size="sm"><svg xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" viewBox="0 0 24 24"><g fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round"><circle cx="12" cy="12" r="9"></circle><path d="M9 12l2 2l4-4"></path></g></svg></cosy-icon></cosy-tooltip>
<span>03-15 14:44:57</span>
</div>
<div class="timeline-marker"></div>
<div class="timeline-content">
<div class="timeline-title ellipsis">
<span>短视频账号起号逻辑</span>
</div>
<p>抖音流量池
级别
曝光次数
播放量范围
初级流量池
冷启动
0~500
二次曝光
3K~5K
三次曝光
1W~2W
四次曝光(人工复审)
10W~15W
中级流量池
五...</p>
</div>
</a>
</li>
<li> <li>
<a class="timeline-item" href="/posts/8323/"> <a class="timeline-item" href="/posts/8323/">
<div class="timeline-info"> <div class="timeline-info">
@ -516,6 +467,55 @@ typedef struct&amp;#123;
</a> </a>
</li> </li>
<li>
<a class="timeline-item" href="/posts/58551/">
<div class="timeline-info">
<cosy-tooltip><span slot="content">完成</span><cosy-icon size="sm"><svg xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" viewBox="0 0 24 24"><g fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round"><circle cx="12" cy="12" r="9"></circle><path d="M9 12l2 2l4-4"></path></g></svg></cosy-icon></cosy-tooltip>
<span>03-15 14:44:57</span>
</div>
<div class="timeline-marker"></div>
<div class="timeline-content">
<div class="timeline-title ellipsis">
<span>短视频账号起号逻辑</span>
</div>
<p>抖音流量池
级别
曝光次数
播放量范围
初级流量池
冷启动
0~500
二次曝光
3K~5K
三次曝光
1W~2W
四次曝光(人工复审)
10W~15W
中级流量池
五...</p>
</div>
</a>
</li>
<li> <li>
<a class="timeline-item" href="/posts/31204/"> <a class="timeline-item" href="/posts/31204/">
<div class="timeline-info"> <div class="timeline-info">

View File

@ -197,7 +197,7 @@
<span>RAG知识库召回率</span> <span>RAG知识库召回率</span>
</div> </div>
<p>通用的RAG方案的召回率不一定召回率越高越好对于准确性也需要考虑通用的召回率大概在70%不论是dify还是fastgpt对于生产场景要求起码到90%的水平 <p>通用的RAG方案的召回率不一定召回率越高越好对于准确性也需要考虑通用的召回率大概在70%不论是dify还是fastgpt对于生产场景要求起码到90%的水平
意图分类类似 xxx企业的董事长是...</p> 意图分类提问的内容很短、缩写的情况...</p>
</div> </div>
</a> </a>
</li> </li>
@ -347,55 +347,6 @@ typedef struct&amp;#123;
</a> </a>
</li> </li>
<li>
<a class="timeline-item" href="/posts/58551/">
<div class="timeline-info">
<cosy-tooltip><span slot="content">完成</span><cosy-icon size="sm"><svg xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" viewBox="0 0 24 24"><g fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round"><circle cx="12" cy="12" r="9"></circle><path d="M9 12l2 2l4-4"></path></g></svg></cosy-icon></cosy-tooltip>
<span>03-15 14:44:57</span>
</div>
<div class="timeline-marker"></div>
<div class="timeline-content">
<div class="timeline-title ellipsis">
<span>短视频账号起号逻辑</span>
</div>
<p>抖音流量池
级别
曝光次数
播放量范围
初级流量池
冷启动
0~500
二次曝光
3K~5K
三次曝光
1W~2W
四次曝光(人工复审)
10W~15W
中级流量池
五...</p>
</div>
</a>
</li>
<li> <li>
<a class="timeline-item" href="/posts/8323/"> <a class="timeline-item" href="/posts/8323/">
<div class="timeline-info"> <div class="timeline-info">
@ -516,6 +467,55 @@ typedef struct&amp;#123;
</a> </a>
</li> </li>
<li>
<a class="timeline-item" href="/posts/58551/">
<div class="timeline-info">
<cosy-tooltip><span slot="content">完成</span><cosy-icon size="sm"><svg xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" viewBox="0 0 24 24"><g fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round"><circle cx="12" cy="12" r="9"></circle><path d="M9 12l2 2l4-4"></path></g></svg></cosy-icon></cosy-tooltip>
<span>03-15 14:44:57</span>
</div>
<div class="timeline-marker"></div>
<div class="timeline-content">
<div class="timeline-title ellipsis">
<span>短视频账号起号逻辑</span>
</div>
<p>抖音流量池
级别
曝光次数
播放量范围
初级流量池
冷启动
0~500
二次曝光
3K~5K
三次曝光
1W~2W
四次曝光(人工复审)
10W~15W
中级流量池
五...</p>
</div>
</a>
</li>
<li> <li>
<a class="timeline-item" href="/posts/31204/"> <a class="timeline-item" href="/posts/31204/">
<div class="timeline-info"> <div class="timeline-info">

View File

@ -197,7 +197,7 @@
<span>RAG知识库召回率</span> <span>RAG知识库召回率</span>
</div> </div>
<p>通用的RAG方案的召回率不一定召回率越高越好对于准确性也需要考虑通用的召回率大概在70%不论是dify还是fastgpt对于生产场景要求起码到90%的水平 <p>通用的RAG方案的召回率不一定召回率越高越好对于准确性也需要考虑通用的召回率大概在70%不论是dify还是fastgpt对于生产场景要求起码到90%的水平
意图分类类似 xxx企业的董事长是...</p> 意图分类提问的内容很短、缩写的情况...</p>
</div> </div>
</a> </a>
</li> </li>
@ -347,55 +347,6 @@ typedef struct&amp;#123;
</a> </a>
</li> </li>
<li>
<a class="timeline-item" href="/posts/58551/">
<div class="timeline-info">
<cosy-tooltip><span slot="content">完成</span><cosy-icon size="sm"><svg xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" viewBox="0 0 24 24"><g fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round"><circle cx="12" cy="12" r="9"></circle><path d="M9 12l2 2l4-4"></path></g></svg></cosy-icon></cosy-tooltip>
<span>03-15 14:44:57</span>
</div>
<div class="timeline-marker"></div>
<div class="timeline-content">
<div class="timeline-title ellipsis">
<span>短视频账号起号逻辑</span>
</div>
<p>抖音流量池
级别
曝光次数
播放量范围
初级流量池
冷启动
0~500
二次曝光
3K~5K
三次曝光
1W~2W
四次曝光(人工复审)
10W~15W
中级流量池
五...</p>
</div>
</a>
</li>
<li> <li>
<a class="timeline-item" href="/posts/8323/"> <a class="timeline-item" href="/posts/8323/">
<div class="timeline-info"> <div class="timeline-info">
@ -516,6 +467,55 @@ typedef struct&amp;#123;
</a> </a>
</li> </li>
<li>
<a class="timeline-item" href="/posts/58551/">
<div class="timeline-info">
<cosy-tooltip><span slot="content">完成</span><cosy-icon size="sm"><svg xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" viewBox="0 0 24 24"><g fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round"><circle cx="12" cy="12" r="9"></circle><path d="M9 12l2 2l4-4"></path></g></svg></cosy-icon></cosy-tooltip>
<span>03-15 14:44:57</span>
</div>
<div class="timeline-marker"></div>
<div class="timeline-content">
<div class="timeline-title ellipsis">
<span>短视频账号起号逻辑</span>
</div>
<p>抖音流量池
级别
曝光次数
播放量范围
初级流量池
冷启动
0~500
二次曝光
3K~5K
三次曝光
1W~2W
四次曝光(人工复审)
10W~15W
中级流量池
五...</p>
</div>
</a>
</li>
<li> <li>
<a class="timeline-item" href="/posts/31204/"> <a class="timeline-item" href="/posts/31204/">
<div class="timeline-info"> <div class="timeline-info">

View File

@ -197,7 +197,7 @@
<span>RAG知识库召回率</span> <span>RAG知识库召回率</span>
</div> </div>
<p>通用的RAG方案的召回率不一定召回率越高越好对于准确性也需要考虑通用的召回率大概在70%不论是dify还是fastgpt对于生产场景要求起码到90%的水平 <p>通用的RAG方案的召回率不一定召回率越高越好对于准确性也需要考虑通用的召回率大概在70%不论是dify还是fastgpt对于生产场景要求起码到90%的水平
意图分类类似 xxx企业的董事长是...</p> 意图分类提问的内容很短、缩写的情况...</p>
</div> </div>
</a> </a>
</li> </li>
@ -347,55 +347,6 @@ typedef struct&amp;#123;
</a> </a>
</li> </li>
<li>
<a class="timeline-item" href="/posts/58551/">
<div class="timeline-info">
<cosy-tooltip><span slot="content">完成</span><cosy-icon size="sm"><svg xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" viewBox="0 0 24 24"><g fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round"><circle cx="12" cy="12" r="9"></circle><path d="M9 12l2 2l4-4"></path></g></svg></cosy-icon></cosy-tooltip>
<span>03-15 14:44:57</span>
</div>
<div class="timeline-marker"></div>
<div class="timeline-content">
<div class="timeline-title ellipsis">
<span>短视频账号起号逻辑</span>
</div>
<p>抖音流量池
级别
曝光次数
播放量范围
初级流量池
冷启动
0~500
二次曝光
3K~5K
三次曝光
1W~2W
四次曝光(人工复审)
10W~15W
中级流量池
五...</p>
</div>
</a>
</li>
<li> <li>
<a class="timeline-item" href="/posts/8323/"> <a class="timeline-item" href="/posts/8323/">
<div class="timeline-info"> <div class="timeline-info">
@ -516,6 +467,55 @@ typedef struct&amp;#123;
</a> </a>
</li> </li>
<li>
<a class="timeline-item" href="/posts/58551/">
<div class="timeline-info">
<cosy-tooltip><span slot="content">完成</span><cosy-icon size="sm"><svg xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" viewBox="0 0 24 24"><g fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round"><circle cx="12" cy="12" r="9"></circle><path d="M9 12l2 2l4-4"></path></g></svg></cosy-icon></cosy-tooltip>
<span>03-15 14:44:57</span>
</div>
<div class="timeline-marker"></div>
<div class="timeline-content">
<div class="timeline-title ellipsis">
<span>短视频账号起号逻辑</span>
</div>
<p>抖音流量池
级别
曝光次数
播放量范围
初级流量池
冷启动
0~500
二次曝光
3K~5K
三次曝光
1W~2W
四次曝光(人工复审)
10W~15W
中级流量池
五...</p>
</div>
</a>
</li>
<li> <li>
<a class="timeline-item" href="/posts/31204/"> <a class="timeline-item" href="/posts/31204/">
<div class="timeline-info"> <div class="timeline-info">

View File

@ -197,7 +197,7 @@
<span>RAG知识库召回率</span> <span>RAG知识库召回率</span>
</div> </div>
<p>通用的RAG方案的召回率不一定召回率越高越好对于准确性也需要考虑通用的召回率大概在70%不论是dify还是fastgpt对于生产场景要求起码到90%的水平 <p>通用的RAG方案的召回率不一定召回率越高越好对于准确性也需要考虑通用的召回率大概在70%不论是dify还是fastgpt对于生产场景要求起码到90%的水平
意图分类类似 xxx企业的董事长是...</p> 意图分类提问的内容很短、缩写的情况...</p>
</div> </div>
</a> </a>
</li> </li>
@ -347,55 +347,6 @@ typedef struct&amp;#123;
</a> </a>
</li> </li>
<li>
<a class="timeline-item" href="/posts/58551/">
<div class="timeline-info">
<cosy-tooltip><span slot="content">完成</span><cosy-icon size="sm"><svg xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" viewBox="0 0 24 24"><g fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round"><circle cx="12" cy="12" r="9"></circle><path d="M9 12l2 2l4-4"></path></g></svg></cosy-icon></cosy-tooltip>
<span>03-15 14:44:57</span>
</div>
<div class="timeline-marker"></div>
<div class="timeline-content">
<div class="timeline-title ellipsis">
<span>短视频账号起号逻辑</span>
</div>
<p>抖音流量池
级别
曝光次数
播放量范围
初级流量池
冷启动
0~500
二次曝光
3K~5K
三次曝光
1W~2W
四次曝光(人工复审)
10W~15W
中级流量池
五...</p>
</div>
</a>
</li>
<li> <li>
<a class="timeline-item" href="/posts/8323/"> <a class="timeline-item" href="/posts/8323/">
<div class="timeline-info"> <div class="timeline-info">
@ -516,6 +467,55 @@ typedef struct&amp;#123;
</a> </a>
</li> </li>
<li>
<a class="timeline-item" href="/posts/58551/">
<div class="timeline-info">
<cosy-tooltip><span slot="content">完成</span><cosy-icon size="sm"><svg xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" viewBox="0 0 24 24"><g fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round"><circle cx="12" cy="12" r="9"></circle><path d="M9 12l2 2l4-4"></path></g></svg></cosy-icon></cosy-tooltip>
<span>03-15 14:44:57</span>
</div>
<div class="timeline-marker"></div>
<div class="timeline-content">
<div class="timeline-title ellipsis">
<span>短视频账号起号逻辑</span>
</div>
<p>抖音流量池
级别
曝光次数
播放量范围
初级流量池
冷启动
0~500
二次曝光
3K~5K
三次曝光
1W~2W
四次曝光(人工复审)
10W~15W
中级流量池
五...</p>
</div>
</a>
</li>
<li> <li>
<a class="timeline-item" href="/posts/31204/"> <a class="timeline-item" href="/posts/31204/">
<div class="timeline-info"> <div class="timeline-info">

View File

@ -197,7 +197,7 @@
<span>RAG知识库召回率</span> <span>RAG知识库召回率</span>
</div> </div>
<p>通用的RAG方案的召回率不一定召回率越高越好对于准确性也需要考虑通用的召回率大概在70%不论是dify还是fastgpt对于生产场景要求起码到90%的水平 <p>通用的RAG方案的召回率不一定召回率越高越好对于准确性也需要考虑通用的召回率大概在70%不论是dify还是fastgpt对于生产场景要求起码到90%的水平
意图分类类似 xxx企业的董事长是...</p> 意图分类提问的内容很短、缩写的情况...</p>
</div> </div>
</a> </a>
</li> </li>
@ -347,55 +347,6 @@ typedef struct&amp;#123;
</a> </a>
</li> </li>
<li>
<a class="timeline-item" href="/posts/58551/">
<div class="timeline-info">
<cosy-tooltip><span slot="content">完成</span><cosy-icon size="sm"><svg xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" viewBox="0 0 24 24"><g fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round"><circle cx="12" cy="12" r="9"></circle><path d="M9 12l2 2l4-4"></path></g></svg></cosy-icon></cosy-tooltip>
<span>03-15 14:44:57</span>
</div>
<div class="timeline-marker"></div>
<div class="timeline-content">
<div class="timeline-title ellipsis">
<span>短视频账号起号逻辑</span>
</div>
<p>抖音流量池
级别
曝光次数
播放量范围
初级流量池
冷启动
0~500
二次曝光
3K~5K
三次曝光
1W~2W
四次曝光(人工复审)
10W~15W
中级流量池
五...</p>
</div>
</a>
</li>
<li> <li>
<a class="timeline-item" href="/posts/8323/"> <a class="timeline-item" href="/posts/8323/">
<div class="timeline-info"> <div class="timeline-info">
@ -516,6 +467,55 @@ typedef struct&amp;#123;
</a> </a>
</li> </li>
<li>
<a class="timeline-item" href="/posts/58551/">
<div class="timeline-info">
<cosy-tooltip><span slot="content">完成</span><cosy-icon size="sm"><svg xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" viewBox="0 0 24 24"><g fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round"><circle cx="12" cy="12" r="9"></circle><path d="M9 12l2 2l4-4"></path></g></svg></cosy-icon></cosy-tooltip>
<span>03-15 14:44:57</span>
</div>
<div class="timeline-marker"></div>
<div class="timeline-content">
<div class="timeline-title ellipsis">
<span>短视频账号起号逻辑</span>
</div>
<p>抖音流量池
级别
曝光次数
播放量范围
初级流量池
冷启动
0~500
二次曝光
3K~5K
三次曝光
1W~2W
四次曝光(人工复审)
10W~15W
中级流量池
五...</p>
</div>
</a>
</li>
<li> <li>
<a class="timeline-item" href="/posts/31204/"> <a class="timeline-item" href="/posts/31204/">
<div class="timeline-info"> <div class="timeline-info">

View File

@ -228,7 +228,7 @@
<!-- 文章标题 --> <!-- 文章标题 -->
<h1 class="post-title"></h1> <h1 class="post-title"></h1>
<div class="last-updated"> <div class="last-updated">
上次更新: 2024-03-28 11:14:44 上次更新: 2024-03-28 12:11:08
</div> </div>
<!-- 文章 --> <!-- 文章 -->
<h1 id="stdio-h"><a href="#stdio-h" class="headerlink" title="stdio.h"></a>stdio.h</h1><table> <h1 id="stdio-h"><a href="#stdio-h" class="headerlink" title="stdio.h"></a>stdio.h</h1><table>

View File

@ -248,14 +248,16 @@
<!-- 文章标题 --> <!-- 文章标题 -->
<h1 class="post-title">RAG知识库召回率</h1> <h1 class="post-title">RAG知识库召回率</h1>
<div class="last-updated"> <div class="last-updated">
上次更新: 2024-03-28 12:10:10 上次更新: 2024-03-28 12:31:56
</div> </div>
<!-- 文章 --> <!-- 文章 -->
<h1 id="通用的RAG方案的召回率"><a href="#通用的RAG方案的召回率" class="headerlink" title="通用的RAG方案的召回率"></a>通用的RAG方案的召回率</h1><p>不一定召回率越高越好,对于准确性也需要考虑,通用的召回率大概在<code>70%</code>,不论是<code>dify</code>还是<code>fastgpt</code>,对于生产场景,要求起码到<code>90%</code>的水平</p> <h1 id="通用的RAG方案的召回率"><a href="#通用的RAG方案的召回率" class="headerlink" title="通用的RAG方案的召回率"></a>通用的RAG方案的召回率</h1><p>不一定召回率越高越好,对于准确性也需要考虑,通用的召回率大概在<code>70%</code>,不论是<code>dify</code>还是<code>fastgpt</code>,对于生产场景,要求起码到<code>90%</code>的水平</p>
<h2 id="意图分类"><a href="#意图分类" class="headerlink" title="意图分类"></a>意图分类</h2><p>类似 <code>xxx企业的董事长是谁</code>,一定不能打错,类似<code>QA</code>,上一代的客服系统必备的</p> <h2 id="意图分类"><a href="#意图分类" class="headerlink" title="意图分类"></a>意图分类</h2><p>提问的内容很短、缩写的情况,如何命中用户的真实意图。这一步可以做一个缓存库当中,直接命中返回结构就行,不需要走<code>LLM</code></p>
<p>针对有明确答案的召回一般都是比较准确的,但是针对有日期、数字类的一般效果会非常不好,可以考虑采用<code>nl2sql</code>的方案,使用<code>fine-tuning</code>,能够做到召回率<code>90%</code>,有专门的模型针对这块,例如微软的<code>RAT-SQL</code>模型。</p> <p>针对<code>QA</code>,类似 <code>xxx企业的董事长是谁</code>,答案是必须正确的,上一代的客服系统必备。直接数据级别的匹配就行,召回一般都是比较准确的。</p>
<p>针对某些场景例如<code>2021年的xxxx</code>,同样的<code>2022年的xxxx</code>也发生了,使用<code>embedding</code>容易给错误召回的,而<code>ES</code>的效果会更好。相当于通过从用户的问题中,捕捉关键词,然后通过这些<code>关键词</code>去库里召回。这样的<code>关键词</code>,可以不断的积累<code>字典</code>,针对关键词给解释。例如:</p>
<p>某个提问<code>什么是RAG</code>,首先<code>RAG</code>对应的解释是:<code>增强向量检索的知识库</code>,那对应又引入的新的<code>关键词</code>,继续递归对新的<code>关键词</code>给出解释,通常迭代个<code>2-5轮</code>,就会有非常好的召回效果。字典里面通常会定义:同义词、类别、上下关系。私用飞书的话,内部标准自带一个<code>词典</code>应用,统一的业务领域的知识、语言体系。并且提供<code>api</code>从词典中提取关键字。直接通过关键字,把词条的内容读取出来。文本提取<code>关键词</code>也有很多开源模型能够提取,但是针对某些专业领域,一些开源不一定具备这样的提取能力。</p>
<p>但是针对有日期、数字类的一般效果会非常不好,可以考虑采用<code>nl2sql</code>的方案,使用<code>fine-tuning</code>,能够做到召回率<code>90%</code>,有专门的模型针对这块,例如微软的<code>RAT-SQL</code>模型。</p>
<p>针对<code>excel</code>类型的文件,直接把数据存到一张<code>宽表</code>中,不要跨表,降低复杂度。针对<code>nl2sql</code>的开源模型的能力基本都是<code>单表</code>,基本可以达到预期</p> <p>针对<code>excel</code>类型的文件,直接把数据存到一张<code>宽表</code>中,不要跨表,降低复杂度。针对<code>nl2sql</code>的开源模型的能力基本都是<code>单表</code>,基本可以达到预期</p>
<p>针对某些场景例如<code>2021年的xxxx</code>,同样的<code>2022年的xxxx</code>也发生了,使用<code>embedding</code>容易给错误召回的,而<code>ES</code>的效果会更好。相当于通过从用户的问题中,捕捉关键词,然后通过这些关键词去库里召回。</p>
<p>针对<code>LLM</code>模型来说,数据治理变的很重要,在数据切分的过程中,需要符合人的逻辑去<code>分词</code>。按照人的逻辑,例如:表格、章节、目录……</p> <p>针对<code>LLM</code>模型来说,数据治理变的很重要,在数据切分的过程中,需要符合人的逻辑去<code>分词</code>。按照人的逻辑,例如:表格、章节、目录……</p>
<h2 id="分词"><a href="#分词" class="headerlink" title="分词"></a>分词</h2><p><code>chunk</code><code>size</code>越大,召回越少</p> <h2 id="分词"><a href="#分词" class="headerlink" title="分词"></a>分词</h2><p><code>chunk</code><code>size</code>越大,召回越少</p>
<h2 id="embedding"><a href="#embedding" class="headerlink" title="embedding"></a>embedding</h2><p><code>embedding方案</code>可以考虑引入<code>link memory</code>,可以提高<code>10%-20%</code>,在医疗文献领域,根据参考材料写综述是非常专业的。</p> <h2 id="embedding"><a href="#embedding" class="headerlink" title="embedding"></a>embedding</h2><p><code>embedding方案</code>可以考虑引入<code>link memory</code>,可以提高<code>10%-20%</code>,在医疗文献领域,根据参考材料写综述是非常专业的。</p>

View File

@ -273,7 +273,7 @@
<p><a target="_blank" rel="noopener" href="https://baidu.com/">https://baidu.com</a></p> <p><a target="_blank" rel="noopener" href="https://baidu.com/">https://baidu.com</a></p>
<p><a target="_blank" rel="noopener" href="http://www.this-anchor-link.com/">锚点链接</a> </p> <p><a target="_blank" rel="noopener" href="http://www.this-anchor-link.com/">锚点链接</a> </p>
<p><a href="mailto:test.test@gmail.com">mailto:test.test@gmail.com</a></p> <p><a href="mailto:test.test@gmail.com">mailto:test.test@gmail.com</a></p>
<p>GFM a-tail link <a target="_blank" rel="noopener" href="https://my.oschina.net/u/3691274">@pandao</a> 邮箱地址自动链接 <a href="mailto:&#116;&#x65;&#115;&#116;&#46;&#x74;&#101;&#x73;&#x74;&#64;&#103;&#x6d;&#97;&#105;&#108;&#46;&#x63;&#x6f;&#109;">&#116;&#x65;&#115;&#116;&#46;&#x74;&#101;&#x73;&#x74;&#64;&#103;&#x6d;&#97;&#105;&#108;&#46;&#x63;&#x6f;&#109;</a> <a href="mailto:&#119;&#119;&#119;&#x40;&#x76;&#x69;&#x70;&#46;&#113;&#x71;&#46;&#x63;&#111;&#x6d;">&#119;&#119;&#119;&#x40;&#x76;&#x69;&#x70;&#46;&#113;&#x71;&#46;&#x63;&#111;&#x6d;</a></p> <p>GFM a-tail link <a target="_blank" rel="noopener" href="https://my.oschina.net/u/3691274">@pandao</a> 邮箱地址自动链接 <a href="mailto:&#116;&#101;&#x73;&#x74;&#46;&#116;&#x65;&#x73;&#x74;&#64;&#x67;&#109;&#97;&#x69;&#108;&#x2e;&#99;&#x6f;&#109;">&#116;&#101;&#x73;&#x74;&#46;&#116;&#x65;&#x73;&#x74;&#64;&#x67;&#109;&#97;&#x69;&#108;&#x2e;&#99;&#x6f;&#109;</a> <a href="mailto:&#x77;&#x77;&#119;&#x40;&#x76;&#x69;&#x70;&#x2e;&#x71;&#x71;&#46;&#x63;&#111;&#109;">&#x77;&#x77;&#119;&#x40;&#x76;&#x69;&#x70;&#x2e;&#x71;&#x71;&#46;&#x63;&#111;&#109;</a></p>
<blockquote> <blockquote>
<p>@pandao</p> <p>@pandao</p>
</blockquote> </blockquote>

View File

@ -12,13 +12,21 @@ abbrlink: 21037
## 意图分类 ## 意图分类
类似 `xxx企业的董事长是谁`,一定不能打错,类似`QA`,上一代的客服系统必备的 提问的内容很短、缩写的情况,如何命中用户的真实意图。这一步可以做一个缓存库当中,直接命中返回结构就行,不需要走`LLM`
针对有明确答案的召回一般都是比较准确的,但是针对有日期、数字类的一般效果会非常不好,可以考虑采用`nl2sql`的方案,使用`fine-tuning`,能够做到召回率`90%`,有专门的模型针对这块,例如微软的`RAT-SQL`模型。 针对`QA`,类似 `xxx企业的董事长是谁`,答案是必须正确的,上一代的客服系统必备。直接数据级别的匹配就行,召回一般都是比较准确的。
针对某些场景例如`2021年的xxxx`,同样的`2022年的xxxx`也发生了,使用`embedding`容易给错误召回的,而`ES`的效果会更好。相当于通过从用户的问题中,捕捉关键词,然后通过这些`关键词`去库里召回。这样的`关键词`,可以不断的积累`字典`,针对关键词给解释。例如:
某个提问`什么是RAG`,首先`RAG`对应的解释是:`增强向量检索的知识库`,那对应又引入的新的`关键词`,继续递归对新的`关键词`给出解释,通常迭代个`2-5轮`,就会有非常好的召回效果。字典里面通常会定义:同义词、类别、上下关系。私用飞书的话,内部标准自带一个`词典`应用,统一的业务领域的知识、语言体系。并且提供`api`从词典中提取关键字。直接通过关键字,把词条的内容读取出来。文本提取`关键词`也有很多开源模型能够提取,但是针对某些专业领域,一些开源不一定具备这样的提取能力。
但是针对有日期、数字类的一般效果会非常不好,可以考虑采用`nl2sql`的方案,使用`fine-tuning`,能够做到召回率`90%`,有专门的模型针对这块,例如微软的`RAT-SQL`模型。
针对`excel`类型的文件,直接把数据存到一张`宽表`中,不要跨表,降低复杂度。针对`nl2sql`的开源模型的能力基本都是`单表`,基本可以达到预期 针对`excel`类型的文件,直接把数据存到一张`宽表`中,不要跨表,降低复杂度。针对`nl2sql`的开源模型的能力基本都是`单表`,基本可以达到预期
针对某些场景例如`2021年的xxxx`,同样的`2022年的xxxx`也发生了,使用`embedding`容易给错误召回的,而`ES`的效果会更好。相当于通过从用户的问题中,捕捉关键词,然后通过这些关键词去库里召回。
针对`LLM`模型来说,数据治理变的很重要,在数据切分的过程中,需要符合人的逻辑去`分词`。按照人的逻辑,例如:表格、章节、目录…… 针对`LLM`模型来说,数据治理变的很重要,在数据切分的过程中,需要符合人的逻辑去`分词`。按照人的逻辑,例如:表格、章节、目录……