Meta Llama 3 正式发布!如何在线体验和本地安装部署?

Meta 宣布推出下一代开源大语言模型Llama 3,标志着AI发展新里程碑。该模型分为80亿和700亿参数两个版本,被誉为”Llama 2的重大飞跃”,为大规模语言模型树立新标杆。

值得一提的是,Llama 3已与Meta AI助手深度集成,未来还将陆续在AWS、Databricks、Google Cloud等多个云平台上线,并获得AMD、Intel、NVIDIA等硬件厂商的支持,进一步扩大应用场景。

该模型的发布彰显了Meta在开源AI领域的决心和影响力。我们有理由期待,Llama 3将为自然语言处理、机器学习等AI前沿技术的发展注入新动力。

在线使用:【链接直达

不仅可以智能对话,也可以在线生成图片

图片[1]-Meta Llama 3 正式发布!如何在线体验和本地安装部署?-零度会员 图片[2]-Meta Llama 3 正式发布!如何在线体验和本地安装部署?-零度会员

 

本地安装部署:

1.从github下载Llama 3 项目文件

点击下载】、【网盘下载

2.申请模型下载链接 (申请秒过)

点击申请

申请后会在邮件里提供一个下载链接

3.安装环境依赖

在Llama3最高级目录执行以下命令(建议在安装了python的conda环境下执行)

pip install -e .

4.下载Llama3模型,执行以下命令:

bash download.sh

 

运行命令后在终端下输入邮件里获取到下载链接,并选择你需要的模型,比如我选择8B-instruct

图片[3]-Meta Llama 3 正式发布!如何在线体验和本地安装部署?-零度会员

 

如果你在下载的时候出现这个错误,那是因为你电脑上没有安装Wget命令的环境,你只需【下载wget】、或【网盘下载

下载以后把wget.exe程序放在C:\Windows\System32 目录下就可以解决!看零度视频里的演示即可

 

图片[4]-Meta Llama 3 正式发布!如何在线体验和本地安装部署?-零度会员

5. 运行示例脚本,执行以下命令:

torchrun --nproc_per_node 1 example_chat_completion.py \
    --ckpt_dir Meta-Llama-3-8B-Instruct/ \
    --tokenizer_path Meta-Llama-3-8B-Instruct/tokenizer.model \
    --max_seq_len 512 --max_batch_size 6

 

6.创建自己的对话脚本,在根目录下创建以下chat.py脚本

# Copyright (c) Meta Platforms, Inc. and affiliates.
# This software may be used and distributed in accordance with the terms of the Llama 3 Community License Agreement.

from typing import List, Optional

import fire

from llama import Dialog, Llama


def main(
    ckpt_dir: str,
    tokenizer_path: str,
    temperature: float = 0.6,
    top_p: float = 0.9,
    max_seq_len: int = 512,
    max_batch_size: int = 4,
    max_gen_len: Optional[int] = None,
):
    """
    Examples to run with the models finetuned for chat. Prompts correspond of chat
    turns between the user and assistant with the final one always being the user.

    An optional system prompt at the beginning to control how the model should respond
    is also supported.

    The context window of llama3 models is 8192 tokens, so `max_seq_len` needs to be <= 8192.

    `max_gen_len` is optional because finetuned models are able to stop generations naturally.
    """
    generator = Llama.build(
        ckpt_dir=ckpt_dir,
        tokenizer_path=tokenizer_path,
        max_seq_len=max_seq_len,
        max_batch_size=max_batch_size,
    )

    # Modify the dialogs list to only include user inputs
    dialogs: List[Dialog] = [
        [{"role": "user", "content": ""}],  # Initialize with an empty user input
    ]

    # Start the conversation loop
    while True:
        # Get user input
        user_input = input("You: ")
        
        # Exit loop if user inputs 'exit'
        if user_input.lower() == 'exit':
            break
        
        # Append user input to the dialogs list
        dialogs[0][0]["content"] = user_input

        # Use the generator to get model response
        result = generator.chat_completion(
            dialogs,
            max_gen_len=max_gen_len,
            temperature=temperature,
            top_p=top_p,
        )[0]

        # Print model response
        print(f"Model: {result['generation']['content']}")

if __name__ == "__main__":
    fire.Fire(main)

运行以下命令就可以开始对话:

torchrun --nproc_per_node 1 chat.py     --ckpt_dir Meta-Llama-3-8B-Instruct/     --tokenizer_path Meta-Llama-3-8B-Instruct/tokenizer.model     --max_seq_len 512 --max_batch_size 6

 

THE END
点赞2176 分享
相关推荐
MacOS 12.1 Beta最新版升级工具-零度会员

MacOS 12.1 Beta最新版升级工具

MacOS 12.1 Beta最新版升级工具:点击下载 macOS Monterey 更新可增强 Mac 的稳定性、性能或兼容性,建议 macOS Monterey 的所有用户都安装这些更新。
admin的头像-零度会员admin
1.6W+2251
谷歌在 Windows PC 上推出 Android 游戏测试版 2-零度会员

谷歌在 Windows PC 上推出 Android 游戏测试版 2

谷歌正在推出其应用程序的有限测试版,以便将 Android 游戏带到 Windows PC。Google Play Games 将于今天在香港、韩国和台湾推出测试版,让 Windows PC 用户可以玩热门的 Android 游戏,如Mobil...
admin的头像-零度会员admin
1.5W+2252
DuckDuckGo 的新 Web 浏览器中的最佳隐私功能-零度会员

DuckDuckGo 的新 Web 浏览器中的最佳隐私功能

DuckDuckGo 的新网络浏览器为 Mac 带来了一些杀手级的隐私功能。   很难说服人们改变,但切换到不同的网络浏览器尤其困难。无论您是 Chrome、Edge、Safari 还是其他数十种选项之一,您都喜...
admin的头像-零度会员admin
1.7W+2250
卡巴斯基 称美国在 iOS 零点击攻击中入侵了数千部 iPhone-零度会员

卡巴斯基 称美国在 iOS 零点击攻击中入侵了数千部 iPhone

俄罗斯网络安全公司卡巴斯基表示,其网络上的一些 iPhone 被黑客利用 iOS 漏洞入侵,该漏洞通过 iMessage 零点击漏洞安装恶意软件。 消息的传递利用了一个漏洞,该漏洞导致无需任何用户交互即可...
admin的头像-零度会员admin
1.3W+6539
使用黑苹果系统的最大痛点! 附解决方法 | Windows用户首次使用苹果系统必看教程-零度会员
世界首位AI工程师! 能自行完成整个软件项目-零度会员

世界首位AI工程师! 能自行完成整个软件项目

世界首位自主型人工智能工程师'Devin'面世 据报道,新兴公司'认知'(Cognition)近日推出了一款名为'Devin'的人工智能软件开发助手。这位自主型人工智能工程师具有编码能力和独立作业的能力,可以媲...
admin的头像-零度会员admin
1.3W+1527
Inpaint(图片修复、放大)神器!纯浏览器端实现,完全免费开源-零度会员

Inpaint(图片修复、放大)神器!纯浏览器端实现,完全免费开源

Inpaint 是一个免费的开源修复和图像放大工具,由浏览器上的 webgpu 和 wasm 提供支持。 基于Webgpu技术和wasm技术的开源免费图像修复工具,纯浏览器端实现。 在线体验:【点击前往】 开源项目...
admin的头像-零度会员admin
2.3W+2176
智能手机车载出风口的隐患-零度会员

智能手机车载出风口的隐患

我们大多数人在开车时使用手机播放音乐或使用 GPS 导航。因此,我们需要将手机安装在开车时可以看到的地方(当然是免提!)。有许多不同的方法可以做到这一点,例如仪表板支架、磁性支架和夹在...
admin的头像-零度会员admin
1.6W+2251
务必升级!Chrome 推送紧急更新:修复高危漏洞!一个坏消息,一个好消息 | 零度解说-零度会员