deepseek吧 关注:112,917贴子:212,660
  • 24回复贴,共1

求教:关于用anythingllm建立知识库的疑问

只看楼主收藏回复

我安装配置好之后,上传了三个教材文件abc,把三个文件都按了钉子符号,让ds告诉我三个教材的目录,结果出现的情况是ds只告诉我第一个文件a的目录,bc说没有检查到。然后我把钉子只钉在bc文件,问同样的问题,它有只告诉我b的目录信息,没有检查到c,什么原因呢?是只能一次检索一个本地文件吗?


IP属地:广东来自Android客户端1楼2025-02-07 22:22回复
    而且我运行的32b的,结果回答我的答案里只告诉我目录的三分之一内容,剩下的没有了(这个教材本来是图片版,我用百度的某个功能转换成文字版)


    IP属地:广东来自Android客户端2楼2025-02-07 22:25
    回复
      可别提了,太蠢了,急死我了快,他根本查不到知识库的内容,求大佬指点


      IP属地:山东3楼2025-02-11 10:49
      收起回复
        我一个文件里的内容都检索不全


        IP属地:上海来自手机贴吧4楼2025-02-13 07:55
        收起回复
          明明原文就有答案,还说“具体内容被截断了”


          IP属地:广东5楼2025-02-14 21:47
          回复
            我也遇到类似的问题,我的是一个5000字的文本,只查到开头和结尾的内容,中间的段落一问三不知,换了别的文档也是如此


            IP属地:广西6楼2025-02-17 09:11
            收起回复
              我也是,真服了,放了一段贴吧数据集进去,每次提问要么是没参考,要么是参考了还是按照自己意思回复。


              IP属地:上海7楼2025-02-18 18:03
              回复
                各位,我发现不仅本地部署的知识库是这样,连知乎部署的知识库上传文件也是有毛病,我上传了一个word文档转为pdf的文件,有6页,ds只能检索到前五页,到底是ds的锅还是知识库的锅


                IP属地:广东来自Android客户端8楼2025-02-19 09:18
                回复
                  不是,要设置。


                  IP属地:广东来自Android客户端9楼2025-02-22 13:47
                  收起回复
                    接上文,模型的话在llm首选项里选你要用的对话模型,比如32b。然后返回聊天界面,进入对话框右边齿轮配置,到聊天界面,有个选择框,选择anythingllm default那个选项,就是默认的意思。不要在这个页面选模型,一定要选default,这样对话模型就默认使用你在llm首选项里的设置。最后拉到设置最下面保存设置,就ok了,当然记得保存设置和pin一下文件。


                    IP属地:广东来自Android客户端10楼2025-02-22 14:09
                    回复
                      「DeepSeek运用技巧大全」,复制整段内容,打开最新版「夸克APP」即可获取。
                      畅享原画,免费5倍速播放,支持AI字幕和投屏,更有网盘TV版。
                      筷莱狴牢蒜鹤签夺郝
                      /~b86e35ypnQ~:/
                      链接:https://pan.quark.cn/s/6541781c9d39


                      IP属地:江西来自Android客户端11楼2025-02-22 14:11
                      回复
                        顺便说下,deepseek模型的上下文极限是128k个token,相当于一次最多能接收约10w-12.8w个字,也就是你max token设置超过128k,它就会报错,你设置max token为128k,一次性喂给他的文档字数超过128k,它也会出现识别不全的情况,这个就没法救了,模型自身的局限性。


                        IP属地:广东来自Android客户端12楼2025-02-22 14:16
                        回复
                          当然你设置max token越高,处理运行就会越慢,亲测设置128000token速度是羊驼默认的速度的10%左右。


                          IP属地:广东来自Android客户端13楼2025-02-22 14:20
                          收起回复