分类 人工智能 下的文章

https://suno.com/home


开发者 Suno, Inc.
首次发布 2023年12月20日,​21个月前
类型 生成式人工智能
网站 suno.com


suno.png

suno.png

a1.png


Suno是一款生成式人工智能音乐创作程序,旨在产生人声与乐器相结合的逼真歌曲。2023年12月20日,Suno AI在推出网络应用程序并与微软建立合作关系(微软将Suno作为插件纳入Microsoft Copilot)后,开始广泛使用。

Suno AI生成的两分钟英语歌曲范例;其歌词由ChatGPT生成。音乐风格提示为“平静的迷幻摇滚”。
该程式根据用户提供的文字提示来匹配歌曲。Suno没有透露用于训练其人工智能的资料集,但声称已对其进行了保护,以防止剽窃和版权问题。

https://chatglm.cn/

2.png


我是ChatGLM,一个基于人工智能的语言模型。我是由智谱AI公司开发并训练的,旨在为用户提供各种信息和帮助。我的设计初衷是模仿人类的对话方式,以便与用户进行自然、流畅的交流。

我可以回答各种问题,包括但不限于以下领域:

常识性问题
学术研究
技术支持
文学创作
语言学习
娱乐资讯

我还能帮助用户进行数据分析、生成文本、翻译、总结信息等。尽管我拥有广泛的知识库,但我的知识是截至到2023年的,因此我可能不知道那之后发生的事情。我会尽力提供准确和有用的信息,但请注意,我的回答可能需要用户的进一步验证。如果您有任何问题或需要帮助,请随时告诉我!


3.png


智谱清言是由北京智谱华章科技有限公司推出的全新AI助手,以下是对智谱清言的详细介绍:

一、基本信息
上线时间:2023年8月31日
开发公司:北京智谱华章科技有限公司
技术基础:基于智谱AI自主研发的中英双语对话模型ChatGLM2,经过万亿字符的文本与代码预训练,并采用有监督微调技术。

二、功能特点
多种能力:智谱清言具备通用问答、多轮对话、角色扮演、文本生成和代码生成等多种能力。无论是在工作、学习还是日常生活中,它都能解答用户的各类问题,完成各种任务。
语音识别与图像识别:除了文本对话,智谱清言还支持语音识别和图像识别等功能,为用户提供更加全面的服务。
跨平台使用:用户可以通过苹果商店App Store、安卓主流商店(包括华为、OPPO、vivo及小米等)进行下载,或在微信小程序中搜索“智谱清言”使用。同时,也支持直接使用网页版。

三、应用场景
智谱清言的应用场景广泛,包括但不限于以下几个方面:

工作场景:协助处理文档、数据分析和项目管理等工作。
学习场景:提供学习资源、解答学习疑问和辅助学习决策。
日常生活:提供天气预报、新闻资讯和生活助手等功能。

四、公司背景
成立时间:北京智谱清言科技有限公司成立于2023年12月5日。
法定代表人:刘德兵
注册地点:北京市门头沟区莲石湖西路98号院13号楼2层202室
经营范围:技术服务、技术开发、技术咨询、技术交流、技术转让、技术推广;人工智能基础软件开发;人工智能应用软件开发;软件开发;数据处理和存储支持服务;数据处理服务;信息技术咨询服务等。

五、注意事项
智谱清言作为一个AI助手,其回答和建议仅供参考,用户需结合实际情况进行判断和决策。
在使用智谱清言时,请遵守相关法律法规和道德规范,不得用于非法或不良用途。
综上所述,智谱清言是一款功能强大、应用场景广泛的AI助手,能够为用户提供智能化服务。如需了解更多关于智谱清言的信息,请访问其官方网站或相关应用商店进行下载和使用。

以上内容由“文心一言”生成
https://www.thinkbar.net/yiyan.html


https://gemini.google.com/

Gemini.png


Gemini(前称:Bard)是由Google开发的生成式人工智能聊天机器人。它基于同名的Gemini系列大型语言模型。是应对OpenAI公司开发的ChatGPT聊天机器人的崛起而开发的。其在2023年3月以有限的规模推出,2023年5月扩展到更多个国家。2024年2月8日更名为Gemini。

最初基于LaMDA系列大型语言模型(LLM),后来基于PaLM2(LLM),现基于Gemini系列大型语言模型。


开发者 Google DeepMind
首次发布 2023年3月21日,​22个月前
当前版本 2024年10月9日,​4个月前

操作系统
网络应用程序
Android
iOS


语言 46种语言
语言列表

英语、日语、韩语、阿拉伯语、印尼语、孟加拉语、保加利亚语、中文(简体 / 繁体)、克罗地亚语、捷克语、丹麦语、荷兰语、爱沙尼亚语、波斯语、芬兰语、法语、德语、古吉拉特语、希腊语、希伯来语、印地语、匈牙利语、意大利语、卡纳达语、拉脱维亚语、立陶宛语、马拉雅拉姆语、马拉地语、挪威语、波兰语、葡萄牙语、罗马尼亚语、俄语、塞尔维亚语、斯洛伐克语、斯洛文尼亚语、西班牙语、斯瓦希里语、瑞典语、泰米尔语、泰卢固语、泰语、土耳其语、乌克兰语、乌尔都语和越南语


类型 聊天机器人
许可协议 专有
网站 gemini.google.com


2.png


https://www.cosmos.so/


Cosmos 人工智能相关内容主要有英伟达的 Cosmos 世界基础模型平台和 Humane 发布的 CosmOS 操作系统,以下是具体介绍:

英伟达 Cosmos 世界基础模型平台

基本信息:英伟达在 CES2025 大会上推出,旨在加速物理人工智能系统在自动驾驶和机器人领域的发展。


4.png

2.png


主要功能

生成虚拟世界状态:可根据文本、图像或视频提示,生成高度仿真的适用于自动驾驶和机器人应用的虚拟世界状态。
生成式模型应用:基于生成式模型快速生成与真实世界场景相似的数据,辅助开发者训练和评估现有 AI 模型。
高级标记器和数据处理:集成高级标记器和加速视频处理管道,让生成的数据在后续模型训练中发挥更大作用。
安全与合规保障:提供安全防护机制,确保数据安全与合规。
开放模型许可:以开放模型许可的形式在 Hugging Face 和 NVIDIA NGC 目录中提供,方便开发者进行定制化应用。


技术原理

生成式世界基础模型(WFM):采用先进的生成式模型技术,包含扩散模型和自回归 Transformer 模型,能生成与真实世界场景高度相似的合成数据。

高级标记器(Cosmos Tokenizer):使用复杂的编码器 - 解码器结构,结合 3D 因果卷积和注意力机制,高效处理时空信息,将图像和视频分解成高压缩率的高质量标记,为 AI 模型提供更高效的视觉数据。

加速视频处理管道(NeMo Curator):能在短时间内处理大量视频数据。


Humane 的 CosmOS 人工智能驱动操作系统

基本信息:由 Humane 发布,专为智能设备和复杂任务设计。


核心功能与特点

智能代理系统:由多个专注于特定任务(如天气、音乐、任务规划等)的智能代理组成,可自主协作,动态适应用户需求。
AiBus 智能协调核心:整合 AI 模型、数据集、服务和设备功能,动态分配任务、协调数据共享,遇到问题能自动寻找替代方案。

个性化与上下文感知:通过分析用户历史数据和交互记录实时学习优化,结合网络数据和用户输入,提供与当前情境相关的解决方案。

  • 多模态交互:支持语音、文字、触控、手势和视觉等多种输入方式,并可根据用户习惯和当前情境自由切换。
    跨设备适配:可在从可穿戴设备到专业工作站等多种设备上无缝运行,能根据用户认知负担和环境变化调整界面。
    高效与可扩展性:利用先进的并行计算技术快速处理请求,可快速适应新功能、新代理以及最新 AI 技术。
    隐私与安全:保证用户对个人数据的完全控制权,优先在设备本地处理用户数据,还提供企业数据分类、访问权限管理和敏感数据隔离功能。

https://openai.com/

2.png


OpenAI,是一个美国人工智能研究实验室,由非营利组织OpenAI Inc,和其营利组织子公司OpenAI LP所组成。OpenAI进行AI研究的目的是促进和发展友好的人工智能,使人类整体受益。OpenAI系统运行在微软基于Azure的超级计算平台上。

该组织于2015年由萨姆·阿尔特曼、里德·霍夫曼、杰西卡·利文斯顿、伊隆·马斯克、伊尔亚·苏茨克维、沃伊切赫·萨伦巴、彼得·泰尔等人在旧金山成立,他们共同认捐了10亿美元。微软在2019年向OpenAI LP提供了10亿美元的投资,并在2023年1月向其提供了第二笔多年投资,据报导为100亿美元,用于独家授权使用GPT-4,这将为微软自己copilot服务提供支持。