Gemini
本专题深入讲解Gemini脚本的设计与应用,涵盖智能对话、内容创作、代码生成、多模态处理等场景,支持自动化调用Gemini接口,帮助开发者与创作者高效集成AI能力到各类项目中。
文章
Gemini怎样写求职信?2026最直白的求职信Gemin提示词分享
Gemini(尤其是 2.5 Pro / Advanced 版)写求职信效果极佳,前提是提示词要够精准、够完整。下面小编整理了三种层级写法,可以直接复制改几个字就能丢给 Gemini 使用。
2026-03-24
Gemi
Jamba由AI21开源的首款Mamba架构大模型
Jamba是AI21 Labs开源的全球首款Mamba架构大模型,创新性地结合结构化状态空间模型SSM与Transformer混合架构。该模型提供256K上下文窗口,在长文本处理中实现3倍吞吐量提升,支持单GPU处理140K上下文。作为Apache 2.0开源项目,Jamba具备高性能MoE层优化,在语言理解和推理任务中表现优异。
2026-03-25
Gemi
谷歌推出Veo视频模型可生成1分钟1080P高清视频
谷歌DeepMind推出Veo视频生成模型,支持通过文本、图像或视频提示创作1080P高清视频,时长超过一分钟。Veo具备深入的自然语言理解能力,可精准实现延时摄影、航拍等专业效果,视频连贯性和动作表现更逼真。该工具适用于电影制作、广告创意、教育等领域,提供遮罩编辑、风格适配等核心功能,采用Transformer架构和先进生成技术,目前处于实验阶段。
2026-03-25
Gemi
PixelStudio由谷歌打造的AI图像生成工具
Pixel Studio是谷歌专为Pixel 9系列手机打造的AI图像生成工具,基于Imagen 3模型实现快速创作。这款预装应用结合Tensor G4芯片,支持本地和云端生成艺术风格图片,仅需2秒即可完成创作。用户可通过Gemini overlay功能轻松分享AI作品,适合设计师、艺术爱好者等群体作为创意辅助工具使用。
2026-03-25
Gemi
ChatPlaygroundAI-多语言多AI互动聊天机器人平台
ChatPlaygroundAI是多语言多AI互动聊天机器人平台,集成ChatGPT、Gemini等领先AI模型,支持100多种语言交流。用户可在统一界面比较多个AI回答,获得更全面的视角和准确答案。平台提供实时网页搜索、图像生成和专家提示库,满足学术研究、内容创作等需求,帮助开发者和创作者提高效率。
2026-03-25
Gemi
LongCite由清华研发的开源模型助力LLMs实现精准引用有效降低幻觉
LongCite是清华大学研发的开源模型,通过生成细粒度句子级引用提升大型语言模型的可信度。该技术有效降低LLMs的幻觉现象,提供长文本问答服务并支持原文追溯。核心功能包括自动化数据构建流程和LongBench-Cite评测基准,适用于学术研究、法律咨询等场景,增强信息的透明度和可靠性。
2026-03-25
Gemi
15款AI智能体与开发平台无需代码轻松打造AI应用
本文介绍15款无需代码的AI智能体与开发平台,帮助用户轻松打造各类AI应用。这些平台提供自然语言开发、多模型集成、一键部署等功能,支持生成小程序、网页、智能客服等应用类型。无论是企业级管理工具还是个人创意项目,都能通过零代码方式快速实现,降低技术门槛,加速数字化转型。
2026-03-25
Gemi
谷歌Illuminate项目实现学术论文音频化讨论
谷歌Illuminate项目通过AI技术将学术论文转化为生动音频讨论,基于Gemini语言模型生成专家对话式讲解。该工具支持播放速度调节和内容分享,优化碎片化学习体验,适合研究人员、学生及视障人士在通勤或运动时获取学术知识。项目通过自然语言处理实现论文摘要与问答生成,提升计算机科学等领域研究的可访问性。
2026-03-25
Gemi
WhispoAI语音转录工具一键录音与转写
WhispoAI语音转录工具是一款基于OpenAI Whisper技术的智能录音转写软件。它支持一键录音与转写功能,用户只需按住Ctrl键即可完成语音录制并自动转写成文本。该工具具备本地数据处理能力确保隐私安全,同时支持自定义API集成和大型语言模型后处理优化,大幅提升转录准确性。适用于会议记录、教育辅助和无障碍技术等多种场景,帮助用户高效完成语音转文字工作。
2026-03-25
Gemi
了解谷歌最新对话式AI学习助手
谷歌Learn About是基于Gemini模型的对话式AI学习助手,通过问答形式提供简明答案和互动辅导。它能梳理知识点生成内容大纲,连接多学科概念,支持图像视频等多模态学习资源。适用于学术研究备考复习和技能提升,帮助用户深度理解复杂概念并获得参考资料,实现沉浸式学习体验。
2026-03-25
Gemi
阿里推出Qwen2.5-Turbo长文本模型支持1Mtokens上下文长度
阿里推出的Qwen2.5-Turbo长文本模型支持1M tokens上下文长度,可处理相当于150万汉字的长文本内容。该模型基于Transformer架构和稀疏注意力机制,具备高效推理速度和更低价格优势,适用于长篇小说分析、技术文档处理等场景。通过API接入,用户可便捷集成到各类应用中获得强大的语言处理能力。
2026-03-25
Gemi
Find3D-加州理工学院研发的3D组件分割模型
Find3D是加州理工学院研发的3D组件分割模型,通过文本查询实现任意物体的部件分割。该模型采用自动数据引擎生成训练数据,无需人工标注,在Objaverse-General等数据集上性能领先,平均交并比提升3倍。Find3D支持开放世界分割和快速推理,适用于机器人视觉、VR/AR和CAD设计等领域,其对比学习技术确保鲁棒性和查询灵活性。
2026-03-25
Gemi
NVILA英伟达视觉语言大模型问世
NVILA是NVIDIA推出的视觉语言大模型,采用扩展压缩策略高效处理高分辨率图像和长视频。该模型在图像视频基准测试中超越Qwen2VL等顶尖开源模型,支持时间定位和机器人导航功能,特别适用于医疗成像和多模态交互场景。通过FP8混合精度训练和量化技术优化效率,NVILA为视觉语言任务提供高精度解决方案。
2026-03-25
Gemi
谷歌ProjectMariner智能浏览助手可自动处理表格及完成网购
谷歌Project Mariner是DeepMind推出的智能浏览助手,基于Gemini 2.0技术实现浏览器自动化。它能理解网页内容并执行复杂任务,包括自动填写表格、处理数据、完成网购等操作。该工具具备多模态理解能力,可在执行敏感操作前请求用户确认,目前已在WebVoyager测试中取得83.5%的高分表现,适用于旅行规划、日常购物等场景。
2026-03-25
Gemi
AISmartCube-AI应用低代码开发平台拖放式快速搭建AI工具
AISmartCube是AI应用低代码开发平台,支持拖放式快速搭建AI工具。无需编程知识即可接入全球大型语言模型,集成图像识别、语音处理等插件功能。平台提供多样化节点和实时共享知识库,涵盖技术育儿等场景,助力自动化工作流和内容创作。内置AI助手模板可一键调用,大幅提升社交媒体运营与数据分析效率。
2026-03-25
Gemi
人工智能和智能计算的演进历程
本文探讨人工智能与智能计算的演进历程,从机械计算到智能计算时代的跨越。重点分析大模型技术的突破及其在文本生成、视频生成等领域的应用,同时揭示人工智能的安全风险与中国智能计算发展面临的困境。文章提出中国应发展低门槛、安全可信的智能技术,推动AI与实体经济深度融合,为高质量发展注入新动力。
2026-03-25
Gemi
Rooms由前Google员工打造的交互式3D房间设计工具
Rooms是由前Google员工打造的交互式3D房间设计工具,提供超过10000个可编辑物品和Lua编程功能,让用户自由构建个性化数字空间。该工具支持网页端和iOS平台,新增无需编程的动态编辑器,并计划集成AI技术增强交互体验。用户可通过类似TikTok的垂直信息流浏览分享作品,适用于创意表达、游戏开发和教育实践等场景。
2026-03-25
Gemi
热门专题
+ 收藏
+ 收藏
+ 收藏
+ 收藏
+ 收藏
AI精选


