使用LLaMA-Factory框架对GoogleGemma-2b模型进行监督微调,实现IT科技新闻标题生成。采用linux-cn
366
AIAgent工作流通过多次迭代和反思机制,让大模型逐步逼近更高质量的输出。反思作为一种
1120
基于ReAct算法,智能体通过交替进行推理与行动应对复杂任务。利用AgentScope可快速实现:先
1198
大语言模型依赖训练阶段习得的参数知识,无法处理最新或私有数据。检索增强生成(RAG)
322
从Llama-1到Llama-3,Meta开源大模型不断迭代:训练数据从1 4T增至15Ttoken,上下文长度扩展至8K
1746
RAG通过检索外部知识库增强语言模型生成,核心挑战包括检索质量、增强过程和生成质量。
724
Llama3模型架构与Llama2一致,核心提升来自数据工程:预训练数据量达15Ttoken,为Llama2的7倍,
1762
MobiLlama是一款基于LLaMA-7B架构、专为边缘设备设计的小型语言模型,参数规模仅0 5B。通过参
593
UIE是基于ERNIE3 0的中文通用信息抽取框架,支持实体、关系、事件、情感等任务统一建模,
790
ChatOllama项目始于2024年,旨在构建基于Ollama的本地聊天机器人Web应用,后集成知识库功能实
1215