黑料18hlw|「それは――正しくないことだからよcあなたにとっても私にとっても」とずいぶんあとで彼女はそうつづけた。-威尼斯人2299

版本:v66.3.7.8485 官方安卓版大小:68.53m

类别: 系统:android

三言科技 1月25日消息,今日,雷军龙年收官直播。不过,下午1点48分,雷军的抖音直播间突然遭到封禁。三言科技注意到,有网友于下午1点44分发布视频表示,其举报了雷军一边开车,一边直播。该网友发布的“直播举报反馈”截图显示,该网友于下午1点36分提交对用户雷军直播内容的举报。下午1点57分,该网友再次发布作品,为一张“举报结果通知”的截图,内容为“你举报的用户【雷军】的直播内容,经我们核实存在违规行为,已对用户进行【中断直播间】处理,感谢你的监督!”该网友还配文表示:“不好意思啊雷总,我就想试一下,没想到这么快就封了,看来抖音谁也不惯着呀。”三言科技查询发现,雷军在抖音的直播中断了大约一个小时,到下午2点52分,雷军再次开播。目前,雷军的抖音账号5845vip威尼斯电子游戏主页无异常。

2月3日,有网友发视频称,重庆石柱一彩民刮中一注刮刮乐百万大奖,但被彩票点老板抢回,双方引发争执后报警。4日,极目新闻记者从事发地辖区派出所了解到,没有抢夺彩票,系相关人士对兑奖流程拿不准,已告知中奖彩民开市后拿彩票去彩票中心兑奖。现场视频显示,在一个彩票售卖点,有两名女子发生争执后被众人拉开。一名当地网友也向极目新闻记者介绍,中奖的彩票是舅妈刮出来的,而彩票点的老板是舅妈那边的亲戚,“双方不知怎么就吵了起来,但后来警察到场后就调解处理了。”2月4日,事发地附近一彩票店工作人员告诉极目新闻记者,3日确有彩民在广场上的彩票售卖点刮出百万大奖,但没有发生抢彩票的事情,“彩票点老板应该只是拿过来看一下,据说双方还是亲戚。”来源:九派新闻编辑:王丞

据公安部消息,近期,多名中国公民被骗至泰缅边境后遭非法拘禁、从事电信网络诈骗等案件引发社会关注。 公安部对此高度重视,迅速部署相关地方公安机关全力开展人员解救和案件侦查调查,同时派出工作组赴境外开展工作。 经公安部工作组和我驻泰使馆全力工作,在泰执法部门协助下,相关案件的重要犯罪嫌疑人颜某磊(网名“颜十六”)到案并于1月25日晚回国。 目前,公安机关正全力开展案件侦办工作。公安部有关负责人表示,公安机关将认真贯彻落实全国打击治理电信网络诈骗工作视频会议精神,以更大的决心和力度,持续发起严打猛烈攻势,不断深化国际执法合作,加强与相关国家协调配合,全力缉捕违法犯罪嫌疑人,全力协调解救被困人员,最大限度压缩跨境犯罪生存发展空间,坚决保护我国公民人身财产安全。公安机关提醒 广大群众务必提高警惕,加强安全防范,切勿轻信境外高薪招聘、务工信息,避免落入违法犯罪陷阱。来源 公安部值班编辑 古丽星标“新京报”及时接收最新最热的推文点击“在看”,分享热点

直播吧1月25日讯 2025 xgames aspen比赛,谷爱凌在street style的比赛中摔倒受伤,并退出了稍后的u池和大跳台的比赛。赛后,谷爱凌更新了社媒,谈到了自己的退赛。谷爱凌写道:老实说,昨天我的精神和体力都达到了极点。我本打算在两天前的晚上退出,但为了对比赛的热爱和对精神力量的锻炼,我挑战自己,坚持练习,坚持参加比赛。了解我的人都知道,我会一直坚持到练习结束,以增加尝试新项目的难度,我完全可以说,这次我达到了极限。在经历了5天的发烧、熬夜咳嗽、12小时的滑雪和4场不同的活动之后,我的身体已经不堪重负,整个星期我的神经系统都处于超负荷状态。老实说,我为自己能走到今天这一步而感到骄傲,因为我没有放弃,而是付出了一切。谢谢大家的祝福。我没事,但由于上次摔伤时严重瘀伤,现在还不能走路。我会尽快回来,谢谢大家的祝福。

北京时间1月22日,43岁的中国“拳王”邹市明发布视频,回应了关于自己近期创业失败、中年返贫的传闻,邹市明称自己没到“中年返贫”的地步。他表示可以坦坦荡荡地说自己是创业失败,肯定有失去的东西,但是没有网上说得那么夸张,只是拿出了一部分积蓄投入到创业的行业中。邹市明表示,网上传的什么“邹市明深夜崩溃流泪”都是断章取义,那只是他在回忆以前打拳时会流泪。至于重新复出打拳,邹市明直言也和创业失败要还钱无关,只是他觉得做拳手才是更适合自己的职业。最后,邹市明拉出老婆一起鼓劲,也回应了所谓家庭不睦的谣言。现年43岁的邹市明曾在2008年和2012年两次为中国夺得奥运拳击金牌。2013年,他正式进军职业拳坛。邹市明也是熊朝忠之后,中国第二位职业拳王。去年年底,邹市明宣布重返拳坛。不少媒体透露,邹市明重新打拳,是因为他创业失败。此前他用生涯拼尽全力挣来的2亿多元家产,投资了上海1万平米的拳击馆,创业初期,邹市明坦言非常焦虑:“每个月的发薪日,我早上醒来收到银行的扣款短信,一下子几十万就没了。”而最终,夫妻两人用了7年时间就亏完2亿多家产了,不得不把北京、贵州、上海、美国的房子都卖了。邹市明的妻子冉莹颖也曾表示,创业失败后,夫妻两人见面争吵变得更多了,对孩子的照顾更少了。聊的最多的就是谈论如何还钱,连关心和问候都变少了。

北京时间2025年2月17日,《哪吒之魔童闹海》总票房超过120.5亿元,超过此前的全球影史票房第10位《狮子王》,跻身全球影史票房前十,并继续向前冲击。 ​​​自1月29日正式上映以来,《哪吒之魔童闹海》已创造多项纪录:2月6日登顶我国影史票房榜,2月7日登顶全球影史单一市场票房榜,2月13日成为我国影史首部百亿元票房影片……

2月13日,微博认证为“抖音集团副总裁”的账户抖音李亮回应美摄起诉案:一名曾经在美摄工作过的工程师,离职两年半后加入了字节。在字节工作期间,写代码时重复使用了一部分他在美摄工作时写过的代码(经司法鉴定,相关重复代码占比很小,不超过美摄软件的4%、抖音的0.8%)。这种行为,属于严重违规,公司是明令禁止的,目前该员工也已经离职。图片来源:视觉中国-vcg111314256376当然,这个事情也提醒我们要加强管理,事情发生后,我们针对技术人员组织了多次合规培训,还对历史代码进行了系统排查。字节是家致力于技术创新的科技公司,我们坚决反对和禁止这种不合规的行为,因为只有创新才能带来真正的竞争力,这也是很多同事每天在做的。在美国起诉时,美摄还要求字节披露tiktok的全部源代码。这是我们无法接受的。我们曾多次和美摄沟通,愿意向对方提供有诚意的赔偿,但美摄却提出了远超过相关代码实际价值的赔偿诉求——仅在中国法院,美摄就提出了超过20亿的索赔,最后法院支持了8000多万,一些自媒体报道所谓“最高法从重处罚字节跳动代码抄袭案”,显然是受到了某些误导。2月13日,美摄科技官微发布声明称,美摄公司起诉字节跳动旗下抖音等8款产品代码抄袭系列案,历经三年七个月,近日迎来终审判决。美摄科技表示最高人民法院近日作出终审判决,维持一审判决侵权认定的同时,对一审判决损害赔偿额偏低予以改判。二审判决判令抖音公司及其关联公司立即停止侵害美摄sdk软件著作权的行为,向美摄公司赔礼道歉,抖音公司及某员工立即停止侵害美摄公司技术秘密的行为,九案赔偿经济损失及合理支出共计约8266.8万元。据介绍,美摄科技成立于2014年,是一家aigc智能视音频5845vip威尼斯电子游戏的解决方案服务商。基于人工智能、自研视音频引擎等核心技术,为客户提供产品技术授权、5845vip威尼斯电子游戏的解决方案定制、软件定制开发、专业设计定制等服务。每日经济新闻综合公开消息

此次任务是自2023年11月以来星舰持续时间最短的一次试飞。彼时,spacex的星舰在第二次试飞中升空约8分钟后“失联”。周四的意外爆炸对spacex而言是一次挫折,特别是在此前几次试飞中,星舰的性能不断突破,每次发射都推动了火箭的开发进程。spacex将对第七次星舰试飞的数据进行分析,以确定问题原因。 发射直播主持人丹·霍特(dan huot)在直播中告诉观众:“接下来的几个小时或几天里,我们会花时间弄清楚到底发生了什么。之后我们会继续改进,再次发射。”spacex在社交媒体x上发布声明称:“星舰在上升点火过程中经历了一次快速的计划外解体。团队将继续审查此次飞行测试的数据,以更好地了解根本原因。”公司强调:“通过这样的测试,我们才能总结经验教训,取得成功。今天的飞行将帮助我们提升星舰的可靠性。”spacex首席执行官埃隆·马斯克(elon musk)随后也表示,“初步迹象表明,飞船发动机防火墙上方的空腔中发生了氧气/燃料泄漏,泄漏量大到足以使压力超出排气能力。(未来)除了显而易见地重新检查泄漏外,我们将为该区域增加灭火装置,并可能扩大排气面积。目前没有任何迹象表明需要将下一次发射推迟到下个月以后。”马斯克还自嘲称:“成功是不确定的,但娱乐有保证。”本次发射成功回收了超级重型助推器,这对于星舰的开发至关重要。马斯克长期以来声称,星舰的设计目标是实现完全可重复使用,从而显著降低发射成本。去年10月13日,spacex在得克萨斯州博卡奇卡海滩附近的星舰基地成功捕获了一枚超级重型助推器。但在2024年11月19日的第六次星舰试飞中,由于技术问题,spacex未能尝试捕获助推器。当时的测试是在美国当选总统唐纳德·特朗普(donald trump)出席的情况下进行的。如果当时或本次发射不满足捕获条件,超级重型助推器将选择在墨西哥湾进行受控迫降。就在星舰升空前数小时,蓝色起源(blue origin)旗下最新旗舰火箭新格伦号(new glenn)在首次发射中成功进入轨道。这一关键成就表明,亚马逊创始人杰夫·贝索斯(jeff bezos)试图挑战spacex在发射市场的主导地位。 随后,马斯克迅速向贝索斯致以祝贺,庆祝这一里程碑式的突破。在此次星舰试飞中,spacex对火箭进行了多项升级。其中包括改进的推进系统、更强大的飞行计算机,以及增加的飞行监测摄像头,以更全面地记录和优化飞行性能。 火箭的隔热罩也进行了升级,旨在更好地抵御穿越大气层时的极端高温和巨大压力。此外,spacex原计划在飞行中重新点燃飞船六部猛禽发动机中的一部。 这一关键技术对于马斯克实现火星登陆的远大目标至关重要。它不仅能够为星舰在太空中的机动飞行提供动力,还能增强飞船对下降过程的控制能力。尽管如此,星舰过去的试飞经历中不乏爆炸和设备损坏的情况,这些都体现了spacex“飞行-失败-修复”的迭代工程理念。此次试飞的意外失利并未阻挡公司对火箭能力的持续探索和改进。(辰辰)

#头条深一度#1 月 19 日下午 2 时 40 分左右,对于云南德宏梁河的尹先生一家来说,是一场噩梦的开始。当天,尹先生带着8岁女儿尹潇楠与亲戚一行十几人,前往云南腾冲的琅琊山青草岭游玩。然而,仅仅 10 多分钟,尹潇楠就离开了家长的视线,消失在茫茫山林中。据家属介绍,尹潇楠今年就读小学二年级。走失时,她上身穿着有印花图案的黑色短袖 t 恤,下穿藏青色长裤,脚穿粉红色运动鞋。事发后,尹潇楠的家属就向公众发出寻人启事,并宣布悬赏 100 万元以寻回女儿。1 月 22 日午后,家属再度发布寻人讯息,并重申悬赏内容。腾冲市蓝天救援队接到女童家属求助后,已经进行了三天的搜救,截至 22 日下午 5 时许,暂无进展,目前搜救由政府部门主导。据悉,琅琊山海拔在 2900 米至 3400 米之间,部分区域有积雪覆盖,山上昼夜温差大,夜间气温低至 0℃,且地形包含陡坡、断崖和密林,未开发地带还有天然溶洞与暗河,此外该区域有野生黑熊出没,给搜救工作带来了极大的困难。当地公安、应急救援、联防队员、护林员、扑火队、镇村干部、蓝天救援队以及周边群众共 400 余人迅速展开大规模搜寻。搜救人员使用了热成像无人机、搜救犬等先进设备,但由于积雪反射干扰、野生动物气味干扰以及高山磁场异常导致定位偏差等问题,目前仍未发现有效线索。有网友认为家长太粗心,一家人十几个人去山上玩,怎么能让8岁孩子离开视线?雪天就是接近0度,这么冷让孩子只穿短袖t恤带孩子上山,让孩子穿短袖在冰天雪地的山上玩,还能让孩子离开视线十多分钟,感觉有啥隐情。有网友理性地指出应该先关注如何加大搜救力度找到孩子,而不是一味质疑家长,毕竟孩子的安危才是最重要的。有人认为,穿短袖估计是温差高 ,白天温度比较高,玩起来了身体发热,就把外套脱了,但这样失踪了几天,晚上温度那么低,不敢想后果了。很多网友表达了对小女孩的担心:“看了心里好难受,咋就走失找不到72小时了,揪心啊!”有人称,希望她能平安归来,并且表示会帮忙转发寻人启事,让更多人关注到这个事情,帮助寻找线索。一些网友讨论起 100 万赏金,有人觉得这个钱不好拿,必须是安全找到才行,也有人好奇这对教师夫妻能否拿出这么多钱,怀疑可能是向亲戚朋友借的。这起事件反映出家长在带孩子外出游玩时,安全意识还是不够强。即使是在看似不那么危险的游玩环境,也不能放松对孩子的监管,尤其是 8 岁的孩子好奇心强,可能会因为追逐小动物、寻找好玩的东西等而迅速离开家长视线。家长应该时刻保持警惕,让孩子在自己的可控范围内活动。从搜救角度来看,此次搜救难度极大。琅琊山的复杂地形和恶劣天气是主要障碍,积雪、低温、磁场异常等因素对搜救设备和人员都提出了很高的要求。在这种情况下,除了现有的搜救力量和设备,可能还需要更多专业的威尼斯人2299的技术支持,比如更先进的生命探测设备等。而且随着时间的推移,孩子生存的希望会逐渐降低,但只要还有一丝希望,就不能放弃搜救。该事件引发社会广泛关注和讨论,对于家属悬赏 100 万这件事,这是家属在极度焦虑和无助情况下的一种本能反应,也是为了尽可能调动社会力量来帮助寻找孩子,这也体现了社会在遇到此类事件时,大家相互协作、共同努力的重要性。目前,搜救工作仍在紧张进行中,希望广大群众能积极留意相关线索,若有发现,请及时与家属或警方联系,让我们共同努力,帮助尹潇楠早日平安回家。

不知道是真的“被骗”,还是有观众就是喜欢这一口。已经二十多天了,观众们直呼被骗的一部动画电影《我是哪吒2之英雄归来》,现在每天依然能够收获过万人民币票房。即便是刚刚上映的新片,日票房成就都能够被它压一头。如果不仔细看,一开始很多观众都会认为这部《我是哪吒2》,就是当年国产爆火动画影片《哪吒之魔童降世》的续集《哪吒2之魔童闹海》。毕竟除了片名相似之外,该动画影片的宣传海报也与正宗的《哪吒2》同出一辙大同小异。因此一开始刚上映的时候,《我是哪吒2》每天都能收获过百万人民币的票房,不到一周的时间累计总票房就已经突破了1000万人民币。而也就是这个时候,看过此片的观众都发表评论说:“《我是哪吒2》就是一部诈骗电影”,还有观众表示:“大家千万要擦亮眼睛,不要被骗了”。《我是哪吒2》的上映,不只是让观众给予了大量差评,并表示此片就是一部诈骗电影,就连央媒也发表评论批评这部山寨版的《哪吒2》。几天前,人民文娱在社交平台上发布评论说:“这些年,我们吃过康帅傅、奥利粤,喝过王老菊、六个核弹。可你知道,看电影也能看到山寨的吗?”

快科技2月5日消息,今天是蛇年开工第一天,很多企业都会发放"开工利是",讨个好彩头。小米也不例外,小米公司昨天就已经准备好了开工红包,今天由雷军、许斐等高管亲自发放给员工。魏思琪晒图称自己领到两个,她还透露今年有隐藏款,红包中装着蛇年纪念钞。2025年蛇年贺岁纪念钞面额为20元,今年的纪念币、纪念钞十分抢手,一套总价接近1500元。值得注意的是,今年红包封面上还有ultra和小米集团15周年字样。其中的ultra一方面代表小米su7 ultra,今日起样车陆续全国到店,3月发布;另一方面代表着小米15 ultra,将在本月中下旬发布,是蛇年第一款超大杯。据卢伟冰近日介绍:"春节期间,不论是小米手机,还是汽车,还是家电类产品,销售都非常火爆,这是跟往年非常大的不一样。很多用户即便过年回家,还是会优先选择小米之家购物。"近期,小米股票也突破38港元,不断刷新历史新高,在手机、家电等行业稳扎稳打,获得了极高的预期。尤其手机高端化的战略取得出色成果,如今手机方面已经稳坐全球前三,并且遥遥领先于后者,目前的目标就是冲击苹果。

来源:综业网2月9日,小米汽车通过官方微博发布声明,针对近期社交平台上流传的“小米汽车断轴”谣言进行了详细澄清。小米汽车表示,经过全面调查,完全不存在所谓的“断轴”情况。小米汽车呼吁公众理性看待事件,同时强调将坚决反对任何不实信息和恶意诋毁行为。2025年1月30日10点56分,一辆小米汽车在淮安盱眙某乡村公路上发生事故。据调查,事发路段设有明显的20km/h限速标识,但驾驶员以约70km/h的车速高速行驶。在行至一处破损路面时,车辆右后侧轮胎、轮毂及悬架等部位因冲击凹坑边缘而受损。事故发生后,车主于当日11点19分通过线上渠道反馈情况。小米汽车400客服在用户授权下,迅速为其代报保险并安排拖车救援服务。保险勘测员抵达现场后,根据流程要求驾驶员进行酒精检测,但遭到拒绝。最终,车主选择放弃保险索赔,自行承担事故损失,并与保险公司签订了《放弃赔偿声明》。小米汽车通过详实的调查和透明的信息披露,澄清了“断轴”谣言,还原了事故真相。公司强调,推断用户车辆在该路况下严重超速行驶,车辆检测结果为事故的外力受损,非产品质量问题。同时呼吁公众理性看待网络信息,共同维护健康的舆论环境。

查看全部

更新时间:2025-03-12 15:50:29
厂商名称: 广州市动景计算机科技有限公司
包名:com.ucmobile
md5:e277677ed27ec05827483cd4d912d218
权限须知点击查看
网友评论
我要跟贴
  • 回复

    据猫眼专业版数据,2月14日,《哪吒2》总票房不降反升,再次逆跌,单日票房超5.8亿元,相比13日3.6亿元的单日票房成绩上涨超2亿元。截至发稿事件,数据平台给出的票房预测已超160亿元,届时《哪吒2》将超《星球大战:原力觉醒》登顶全球影史票房榜top5。潇湘晨报综合报道

    中国战略新兴产业融媒体记者 艾丽格玛2024年12月26日,深度求索(deepseek)发布了其最新人工智能大模型deepseek v3,并同步开源。这两年来,每家ai公司都会对自己的ai大模型不断进行迭代更新,这已不是什么新闻。然而,deepseek v3的发布却在圈内外引发了热烈的讨论,引发了极大的关注。据称,deepseek v3拥有6710亿参数的混合专家模型(moe)在多项基准测试中表现优异,超越了llama 3.1 405b等开源模型,并与gpt-4o、claude 3.5 sonnet等闭源模型分庭抗礼。而更引人注意的是,根据公开消息,其训练成本仅为557.6万美元,远低于gpt-4o等模型的10亿美元预算。deepseek v3的训练方式与算法优化,显著降低了训练和推理大模型对高端硬件的需求——这背后隐含的可能性是,通过软件优化,可以在有限硬件资源下实现顶尖性能。这一点,可以使得ai大模型大大减少对高端gpu的依赖,甚至有人认为,这套训练算法将对“卖铲子”的英伟达等硬件供应商带来巨大的动荡。01 低成本高性能,怎么做到?deepseek官方在其同步开源的53页deepseek v3模型论文中提到,deepseek v3的生成速度达到每秒60个token,api价格仅为claude 3.5 sonnet的1/53。在知识类任务(包括mmlu、mmlu-pro、gpqa和simpleqa)上,deepseek v3的表现优异,已经接近于当前表现最好的模型,即anthropic公司于10月发布的claude-3.5-sonnet-1022。在美国数学竞赛(aime 2024和math)和全国高中数学联赛(cnmo 2024)上,deepseek v3的表现大幅超过了其他所有开源和闭源模型。>> deepseek开源的文档同时,deepseek v3的生成速度从20tps(每秒完成的事务数量)提高至60tps,相比v2.5模型实现了3倍的提升。这种“低成本≠低性能”的特点,正是deepseek v3热度的来源。那么,这种绕过硬件掣肘,从算法上大幅降低成本的路径,究竟是如何达成的?首先,在架构方面,deepseek v3采用了混合专家架构(mixture-of-experts, moe),包含256个专家,每次计算选取前8个最相关的专家参与。想象一下,有一个机器人,它有很多小助手,也就是“专家”。总共有256个专家,每个专家都擅长做不同的事情。现在,假设机器人要解决一个问题,它不需要让所有的专家都来帮忙,因为那样会浪费时间和精力。相反,它会从这些专家中挑选出最厉害的8个专家来帮忙。这些被选中的专家是最适合解决这个问题的,所以它们可以又快又好地完成任务。这种混合专家架构就像是一个聪明的管理者,总是能选出最合适的人来完成任务,也就可以减少不必要的计算和内存消耗。moe通过动态选择部分专家模型处理输入,减少了不必要的计算开销,显著提升了训练和推理效率,例如,谷歌的gemini 1.5就采用了moe架构,通过路由机制将请求分配给多个专家模型。但是,moe模型仍然有些问题。例如,训练过程较为复杂,尤其是门控网络的设计和专家模型的负载均衡问题,可能导致训练不稳定;moe需要将所有专家模型加载到内存中,显存需求较高,限制了其在资源受限设备上的部署;同时,在分布式计算环境中,moe模型的专家模型可能分布在不同的计算节点上,导致通信开销较大,影响整体效率。moe的选择机制可能导致某些专家被频繁调用(过载),而其他专家则很少被使用(欠载)。这种负载不均衡会降低模型的整体效率,甚至影响性能。为了解决这个问题,传统方法通常会引入辅助损失(auxiliary loss),通过惩罚负载不均衡的情况来强制均衡专家的使用频率。然而,辅助损失本身可能会对模型的主任务性能产生负面影响,因为它会干扰模型的优化目标。因此,deepseek v3在混合专家(moe)架构中,引入了无辅助损失的负载均衡策略,通过动态调整专家偏置值,确保每个专家负载均衡,避免了传统辅助损失对模型性能的负面影响。具体来说,deepseek v3根据每个专家的历史使用频率,实时调整其偏置值(bias)。如果某个专家被频繁调用,其偏置值会被降低,从而减少其被选择的概率;反之,如果某个专家很少被调用,其偏置值会被提高,增加其被选择的概率。由于没有辅助损失的干扰,模型能够专注于主任务优化,从而提升整体性能。而且,动态调整偏置值的计算开销较低,不会显著增加模型的计算负担。同时,避免了辅助损失可能导致的训练不稳定问题,使模型更容易收敛。这种无辅助损失的负载均衡策略,是deepseek v3独有的。另外,在传统的transformer架构中,多头注意力机制(multi-head attention, mha)是核心组件之一。mha通过并行计算多个注意力头,捕捉输入序列中的不同特征。然而,mha需要存储大量的键(key)和值(value)矩阵,尤其是在处理长序列时,内存需求呈平方级增长。而且mha的计算复杂度与序列长度的平方成正比,导致在处理长文本时效率较低。deepseek v3使用的mla通过引入低秩联合压缩技术,将键和值矩阵压缩为潜在向量(latent vectors),这就可以帮它大大减少内存占用和计算开销。除了这些,deepseek v3还自创了一种dualpipe流水线并行算法,这也是其高效训练框架中的一项关键技术。在训练大规模ai模型时,通常需要将计算任务分配到多个gpu或节点上进行分布式训练。然而,分布式训练面临两个主要挑战: 计算与通信的串行化:在传统流水线并行中,计算和通信操作通常是串行进行的,即在进行通信时,计算资源处于空闲状态,导致资源浪费; 通信开销:在跨节点训练中,数据传输(如梯度同步)会占用大量时间,成为训练效率的瓶颈。deepseek v3的dualpipe流水线并行算法通过将计算与通信时间完全重叠,最大化硬件资源的利用率,从而显著提升训练效率。dualpipe算法将训练过程分为两条独立的流水线:计算流水线和通信流水线。 计算流水线负责模型的前向传播和反向传播,而通信流水线负责跨节点的数据传输(如梯度同步)。这两条流水线可以并行运行,互不干扰。dualpipe流水线并行算法在实际应用中取得了显著效果,通过将计算与通信时间完全重叠,dualpipe算法将硬件资源的利用率提升到了接近100%。而且,由于计算和通信并行进行,训练时间显著缩短,尤其是在大规模分布式训练中效果更为明显。通过优化通信内核和充分利用高速网络带宽,dualpipe算法将通信开销也降到了最低。此外,在深度学习训练中,传统的浮点数精度通常是32位(fp32)或16位(fp16)。混合精度训练通过在不同计算阶段使用不同精度的浮点数(如fp16和fp32),在保持模型性能的同时,减少内存占用和计算开销。然而,随着模型规模的不断增大,fp16和fp32的计算和存储开销仍然较高。为了进一步优化资源利用,deepseek v3引入了fp8混合精度训练。fp8是一种8位浮点数格式,其存储和计算开销仅为fp16的一半,fp32的四分之一。包括llama系列、mixtral 8x7b、inflection-2、零一万物的双语llm模型以及coat框架下的模型,都通过fp8技术显著提升了训练效率和资源利用率,同时保持了模型性能。deepseek v3还采用了多令牌预测目标(multi-token prediction, mtp),在训练过程中,模型不仅预测下一个令牌,还同时预测后续的多个令牌。例如,给定输入序列“我喜欢吃”,模型可能同时预测“苹果”“香蕉”“与/和”等多个令牌。这种密集的训练信号显著提高了数据利用率,减少了训练所需的样本数量。在推理阶段,模型能够同时生成多个令牌,从而加速文本生成过程。deepseek v3的开源策略引发了全球开发者的广泛关注。openai创始成员karpathy称赞其“让在有限算力预算上进行模型预训练变得容易”。meta科学家田渊栋则惊叹其训练技术为“黑科技”。最重要的是,这一策略降低了技术门槛,为中小企业和初创公司提供了低成本的高性能ai5845vip威尼斯电子游戏的解决方案。>> deepseek-v3的基本架构示意图。在deepseek-v2的基础上,采用了mla(多头潜在注意力)和deepseek moe,以实现高效的推理和经济高效的训练。整理总结可以发现,deepseek v3不论是采用现有的技术,还是独创自己的路线,都另辟蹊径。这或许与它的母公司和创始人的调性脱不开干系。02 “不务正业”的私募巨头深度求索(deepseek)公司的成立和发展,与量化私募巨头幻方量化有着密切的关系。深度求索成立于2023年7月17日,创始人就是幻方量化的创始人梁文锋。幻方量化是中国知名的量化私募公司,专注于利用算法和高性能计算进行金融投资,幻方量化为深度求索提供了强大的资源支持。彼时,幻方量化是“大厂”外唯一一家储备万张a100芯片的公司,这些高性能计算集群和资金投入使得深度求索能够在短时间内推出高性能的大模型。deepseek一跃成名,起因是他们此前发布的deepseek v2开源模型:deepseek v2的推理成本在当时就被降到每百万token仅 1块钱,约等于llama3 70b的1/7,gpt-4 turbo的1/70——deepseek因而被称作“ai界拼多多”。在低成本的压力下,字节、腾讯、百度、阿里的大模型开始纷纷降价——可以说,中国大模型“价格战”由此而始。受到影响的不只是国内的“大厂”,有不少圈内人士都受到了deepseek开源内容的启发。例如,openai前员工andrew carr从deepseek-v2论文中获取灵感,将其训练设置应用于自己的模型。在硅谷,deepseek被称作“来自东方的神秘力量”。semianalysis首席分析师认为,deepseek v2论文“可能是今年最好的一篇”。openai前政策主管、anthropic联合创始人jack clark认为,deepseek“雇用了一批高深莫测的奇才”,还认为中国制造的大模型,“将和无人机、电动汽车一样,成为不容忽视的力量”。有人认为,这种强烈的反响源自架构层面的创新,这是国产大模型公司乃至全球开源基座大模型都很罕见的尝试。创始人梁文锋早年就读浙江大学电子工程系人工智能方向,无比笃信“人工智能一定会改变世界”。在接受“暗涌”的采访时,梁文锋说:“过去很多年,中国公司习惯了别人做技术创新,我们拿过来做应用变现,但这并非是一种理所当然。这一波浪潮里,我们的出发点,就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。我们认为随着经济发展,中国也要逐步成为贡献者,而不是一直搭便车。过去三十多年it浪潮里,我们基本没有参与到真正的技术创新里。”“中国ai不可能永远处在跟随的位置。我们经常说中国ai和美国有一两年差距,但真实的gap是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。”梁文锋在说到成本路线时,表示很意外:“我们只是按照自己的步调来做事,然后核算成本定价。我们的原则是不贴钱,也不赚取暴利。这个价格也是在成本之上稍微有点利润。”“我们降价,一方面是因为我们在探索下一代模型的结构中,成本先降下来了,另一方面也觉得无论api,还是ai,都应该是普惠的、人人可以用得起的东西。”幻方量化作为量化私募巨头,“囤”了大量的芯片。这也是deepseek得以起步的重要基础。实际上,量化交易需要处理海量数据并进行实时分析,这与ai大模型的训练和推理需求高度契合。幻方量化在高性能计算和分布式系统上的经验,可以直接应用于大模型的开发。同时,量化交易中的算法优化技术(如深度学习、强化学习)与大模型训练中的优化策略(如混合专家架构、fp8混合精度训练)有共通之处。这些技术可以相互借鉴,提升效率。不过,幻方本身的交易成绩和盈利情况在近年来却经历了显著波动,尤其是在2024年。2024年,幻方量化的量化中性策略(如dma策略)因市场波动和监管政策调整(如融券和t 0功能的限制)遭遇了显著回撤。例如,幻方旗下的“慧冲10号a期”在2024年亏损5.36%,近1个月亏损1.33%。2024年初,小微盘股出现流动性危机,导致幻方的量化指增策略(如中证500指增)也受到较大影响。例如,其代表性产品“九章量化多策略1号”在2024年1月至2月期间最大回撤达34.55%。截至2024年7月,幻方量化的旗舰产品“中证500量化多策略”近三年收益率为-12.58%,年内净值收益为-10.07%,与同期中证500指数收益(-10.26%)基本持平。幻方管理的资金规模也从千亿元级的峰值大幅缩减至几百亿。尽管2024年表现不佳,幻方量化在2021年及之前曾取得显著超额收益。据了解,其以指数增强策略为主,通过全市场选股、日内交易和科创板打新等策略获取超额收益。此前,幻方通过多空对冲(如多股票、空股指期货)获取稳定收益,并且是中国首家管理规模突破千亿的量化私募公司。为了在投资之外做更多的研究,搞清楚“什么样的范式可以完整地描述整个金融市场、有没有更简洁的表达方式、不同范式能力边界在哪、这些范式是不是有更广泛适用”之类的问题,幻方从2012年起,就开始关注到算力的储备,并有意识地去部署尽可能多的算力。墙内开花墙外香,可以说,虽然资金规模缩水、业绩表现有争议,但幻方“歪打正着”的开源大模型反而在ai界内掀起了一阵又一阵的巨浪。03 抄了硬件供应商的“老底”?deepseek v3在仅使用2048块nvidia h800 gpu的情况下,完成了6710亿参数模型的训练,成本仅为557.6万美元,远低于其他顶级模型的训练成本(如gpt-4的10亿美元)。这意味着,ai大模型对算力投入的需求可能会从训练侧向推理侧倾斜,即未来对推理算力的需求将成为主要驱动力。而英伟达等硬件商的传统优势更多集中在训练侧,这可能会对其市场地位和战略布局产生影响。训练是指使用大量数据训练ai模型的过程,通常需要极高的计算能力和存储资源。训练过程通常在数据中心完成,耗时较长,成本高昂。推理是指将训练好的模型应用于实际任务(如生成文本、识别图像、推荐商品等),通常需要低延迟和高吞吐量。推理过程可以在云端或边缘设备(如手机、自动驾驶汽车)上进行。为什么推理算力需求会成为主要驱动力?随着各类大模型的成熟,许多企业和开发者可以直接使用预训练模型,而不需要从头训练。例如,gpt-4和本文所述的deepseek v3等模型已经提供了强大的通用能力。对于特定任务,企业通常只需对预训练模型进行微调,而不需要大规模训练,这减少了对训练算力的需求。与之相对地,生成式ai在文本生成、图像生成等领域的应用迅速扩展,推理需求激增。例如,chatgpt每天处理数百万用户的请求,需要强大的推理算力支持。在自动驾驶、智能家居、工业互联网等领域,推理需要在边缘设备上实时完成,这对低功耗、高性能的推理硬件提出了更高要求。训练大模型需要数千甚至数万块gpu,成本高达数百万美元。例如,gpt-4的训练成本估计超过1亿美元。推理对算力的需求远低于训练,但规模更大。chatgpt的推理成本虽然低于训练,但由于用户量巨大,总体算力需求仍然很高。英伟达的gpu(如a100、h100)在训练大模型时表现出色,提供了强大的计算能力和显存带宽。例如,gpt-3的训练使用了数千块英伟达v100 gpu。英伟达的cuda平台还为开发者提供了丰富的工具和库,简化了大规模模型训练的开发过程。所以在训练侧,英伟达的优势几乎是压倒性的。不过,在推理侧,英伟达的gpu能效比相对较低,尤其是在边缘计算场景中,功耗和成本成为瓶颈。以openai为例,虽然它使用英伟达gpu支持chatgpt的推理,但也在探索专用推理硬件以降低成本。还有特斯拉,则是使用自研的fsd芯片(基于npu)进行推理,以满足低功耗和实时性需求。单纯依赖硬件性能的提升已无法完全满足市场需求,而软件优化、算法创新和生态构建的重要性日益凸显。与其说这是对硬件供应商的挑战,不如说,在当前这个“摩尔定律”显著放缓、行业面临瓶颈期的时节,这是一个转型的机遇。随着半导体工艺接近物理极限,硬件性能的提升速度放缓,单纯依赖硬件升级难以满足ai计算的需求。而高端硬件(如gpu、tpu)的采购和维护成本高昂,且能耗较大,无论是在大规模普及中还是对于资金薄弱的中小企业来说,硬件成本费用都是一个沉重的负担。目前看来,deepseek带来的最大的启示,就是通过算法优化(如混合精度训练、模型压缩、量化等),可以在不增加硬件成本的情况下显著提升计算效率。而英伟达等硬件商则更应该通过提供软件工具和框架(如cuda、tensorrt),构建开发者生态,从单纯的硬件销售转向提供综合5845vip威尼斯电子游戏的解决方案(如云服务、ai平台)。例如,英伟达通过cuda平台为开发者提供了丰富的工具和库(如cudnn、cublas),简化了ai模型的开发和优化过程。尽管amd、英特尔等公司推出了类似平台(如rocm、oneapi),但它们在性能和生态成熟度上仍无法与cuda匹敌。semianalysis创始人迪伦·帕特尔(dylan patel)指出,英伟达的竞争优势就在于其软件和硬件的紧密结合,cuda的高效性和易用性使得英伟达在ai芯片市场占据了主导地位。英伟达ceo黄仁勋也认为,cuda正是英伟达从图形处理器公司转型为全球计算巨头的关键。可以预见,未来硬件商将开发更多专用ai硬件(如npu、tpu),并通过算法与硬件的协同设计,进一步提升计算效率和能效比。软硬件协同优化和综合5845vip威尼斯电子游戏的解决方案是未来发展的重要路径。

  • 回复

    近日,网上出现“泰华高级中学开学收取723元作业打印费”的问题反映,2月14日,尖草坪区教育体育局发布情况通报称,已成立调查组介入调查。2月16日晚,太原市尖草坪区教育体育局再次通报此事,称针对“泰华高级中学开学收取723元作业打印费”一事,经该局调查核实,情况基本属实。据通报,网民反映的寒假作业打印费723元、776元、826元(实为836元),实际上分别是该校收取的高一年级、高二年级、高三年级2024—2025学年第一学期学习资料印刷费。通报称,该项收费没有经过公开、公示程序,收取费用时也没有与家长、学生充分沟通,不符合《山西省营利性民办学校监督管理实施办法》相关规定,认定此项收费为违规收费。经研究,责令该校立即纠正其违规收费行为,给予学校全区通报批评,并依法依规对相关责任人进行严肃处理。此前据奔流新闻报道,一名山西网友发布的视频显示,“太原市泰华高级中学,寒假作业要学生交723块钱。”该网友称,这些打印纸张质量很差。也有网友称,723元是对每个高一学生所收取的打印费用,高二、高三学生每人分别收取了776元、826元,且学校只收取现金。太原市泰华高级中学官方信息显示,该校为全日制民办寄宿制学校。学校为原衡水第一中学在省外举办的一所直营学校,全面学习“衡水模式”。该校2022年曾发布声明称,“除正常学费外,本校未收取任何其他费用”。来源 九派新闻综合“尖草坪发布”微信公众号、奔流新闻责任编辑 罗秋旭责任校对 刘自学主编 严云终审 编委 李荣

    #enttext .video-list a,#endtext .video-list a:visited{text-decoration:none;color:#fff;}

  • 回复

    2月12日晚,小米集团董事长雷军在北京小米食堂进行了元宵直播。他回答网友关于小米股价上涨的问题,对购买小米股票的股民称“不用感谢我”,但是如果短期股价跌了“大家也别骂我”,称唯一能保证的就是努力工作为股东挣钱。 2月12日上午,港股小米集团涨超4%,股价续创历史新高。而2月3日开年第一个交易日便突破万亿。目前总市值已达到1.11万亿。

    此次任务是自2023年11月以来星舰持续时间最短的一次试飞。彼时,spacex的星舰在第二次试飞中升空约8分钟后“失联”。周四的意外爆炸对spacex而言是一次挫折,特别是在此前几次试飞中,星舰的性能不断突破,每次发射都推动了火箭的开发进程。spacex将对第七次星舰试飞的数据进行分析,以确定问题原因。 发射直播主持人丹·霍特(dan huot)在直播中告诉观众:“接下来的几个小时或几天里,我们会花时间弄清楚到底发生了什么。之后我们会继续改进,再次发射。”spacex在社交媒体x上发布声明称:“星舰在上升点火过程中经历了一次快速的计划外解体。团队将继续审查此次飞行测试的数据,以更好地了解根本原因。”公司强调:“通过这样的测试,我们才能总结经验教训,取得成功。今天的飞行将帮助我们提升星舰的可靠性。”spacex首席执行官埃隆·马斯克(elon musk)随后也表示,“初步迹象表明,飞船发动机防火墙上方的空腔中发生了氧气/燃料泄漏,泄漏量大到足以使压力超出排气能力。(未来)除了显而易见地重新检查泄漏外,我们将为该区域增加灭火装置,并可能扩大排气面积。目前没有任何迹象表明需要将下一次发射推迟到下个月以后。”马斯克还自嘲称:“成功是不确定的,但娱乐有保证。”本次发射成功回收了超级重型助推器,这对于星舰的开发至关重要。马斯克长期以来声称,星舰的设计目标是实现完全可重复使用,从而显著降低发射成本。去年10月13日,spacex在得克萨斯州博卡奇卡海滩附近的星舰基地成功捕获了一枚超级重型助推器。但在2024年11月19日的第六次星舰试飞中,由于技术问题,spacex未能尝试捕获助推器。当时的测试是在美国当选总统唐纳德·特朗普(donald trump)出席的情况下进行的。如果当时或本次发射不满足捕获条件,超级重型助推器将选择在墨西哥湾进行受控迫降。就在星舰升空前数小时,蓝色起源(blue origin)旗下最新旗舰火箭新格伦号(new glenn)在首次发射中成功进入轨道。这一关键成就表明,亚马逊创始人杰夫·贝索斯(jeff bezos)试图挑战spacex在发射市场的主导地位。 随后,马斯克迅速向贝索斯致以祝贺,庆祝这一里程碑式的突破。在此次星舰试飞中,spacex对火箭进行了多项升级。其中包括改进的推进系统、更强大的飞行计算机,以及增加的飞行监测摄像头,以更全面地记录和优化飞行性能。 火箭的隔热罩也进行了升级,旨在更好地抵御穿越大气层时的极端高温和巨大压力。此外,spacex原计划在飞行中重新点燃飞船六部猛禽发动机中的一部。 这一关键技术对于马斯克实现火星登陆的远大目标至关重要。它不仅能够为星舰在太空中的机动飞行提供动力,还能增强飞船对下降过程的控制能力。尽管如此,星舰过去的试飞经历中不乏爆炸和设备损坏的情况,这些都体现了spacex“飞行-失败-修复”的迭代工程理念。此次试飞的意外失利并未阻挡公司对火箭能力的持续探索和改进。(辰辰)

  • 回复

    今(7)日,红星新闻记者获悉,知名导演陈福黔因病去世,享年81岁。陈福黔1944年出生的陈福黔,少年时曾到重庆生活,15岁时,他正式考进峨影厂高级演员训练班,随即来到成都生活。1978年,34岁的陈福黔凭借过硬的业务能力,考进中央戏剧学院导演系,在那里,他汲取了更多的艺术养分,并结识了李保田、鲍国安、许亚军等实力派演员。作为导演,陈福黔最出名的作品就是和老同学李保田一起合作的“王保长”系列,包括电视剧《王保长新篇》和《王保长新篇2死去生来》。他还执导了不少影视作品,《杨闇公》《江湖恩仇录》《绿茵姑娘》《山月儿》《华夏之灵》《都市俏辣妹》《鲜花盛开的村庄》《希望不流泪》等都出自他手。2006年9月8日,导演陈福黔(左)和王保长的扮演者李保田(右)在《王保长新篇2死去生来》新闻发布会上 资料图现在回看这些电视剧,可谓实力派戏骨云集,李保田、张国立、邓婕、“武松”祝延平、“祁厅长”许亚军、翁虹等,都拍过陈福黔导演的戏。张国立更是从1984年开始与陈福黔合作,拍摄了《密码没有泄露》《死刑已经判决》《带刺的玫瑰》《桃花曲》等多部作品。事实上,陈福黔去年年底还参演了女儿游晓锦执导的新版《傻儿师长》,在剧中出演钱老爷一角。红星新闻记者 邱峻峰 编辑 曾琦

    00:20 近日,国家传染病医学中心,复旦大学附属华山医院张文宏团队在感染病领域顶刊上发表了一项研究。这一研究通过相关对照试验评价国产流感病毒新药物 zx-7101a即玛赛洛沙韦。临床前研究表明,该药物针对甲、乙型流感及高致病性禽流感有广谱抗病毒活性。团队研究结果表明,zx-7101a玛赛洛沙韦能显著加快流感症状缓解。研究团队总结称,单剂量口服该药,能够有效减轻流感症状,快速降低病毒水平并清除病毒,且无需要根据体重调整剂量。同时安全性与安慰剂组相当,具有较好的安全性保障。 国家传染病医学中心主任、华山医院感染科主任张文宏介绍,从临床研究结果来看,药物在用上去以后,病毒转阴时间要比没用药的快一倍左右。服药后20个小时左右,就会感觉到症状出现缓解。 编辑: 范燕菲 责编: 傅群

  • 回复

    2月9日晚,云南丽江机场官方微博发布《 关于旅客孙先生反映问题的处理情况说明》: 2025年2月8日,乘客孙先生乘坐航班从绵阳至丽江机场,计划由丽江乘坐航班到昆明中转前往合肥。 到达丽江机场后,乘客在值机柜台办理值机手续过程中,值机柜台工作人员未能对乘客的问题进行有效答复,服务态度差,存在撕毁登机牌的过激行为。值机维序员发现相关情况后,及时引导乘客至头等舱柜台办理值机,值机值班经理当场对乘客致歉。随后乘客顺利登机。 对涉事员工的过激行为,我们表示诚挚的歉意。下一步,我们将按照规定严肃处理涉事员工,并深刻汲取教训,立即开展中转标识标牌的排查整改,加强员工业务培训,提升员工服务意识。

    #endtext .video-list a:hover .play{opacity: 1;filter:alpha(opacity=100);_filter:progid:dximagetransform.microsoft.alphaimageloader(src="http://static.ws.126.net/video/img14/zhuzhan/play.png");}

  • 回复

    大象新闻记者 赵学玉 吴紫翼大象新闻记者从河南气象了解到,受强冷空气影响,今天早晨河南大部跌破冰点,北部部分站点更是跌破零下10℃,集体上演“速冻”!你那里有多冷?来,说出你的感受 ​​​!

    转自:九派新闻2月15日,有网友发布视频称,四川广元一影城支持《哪吒之魔童闹海》,暂不考虑排片《美国队长4》。16日,九派新闻联系到该影城工作人员。她表示,该影城的放映厅较少,目前要先排片《哪吒之魔童闹海》,至于《美国队长4》,只是暂时不放,目前还不确定之后会不会再排片《美国队长4》。该影城滚动电子显示屏字幕 图/社交媒体视频截图视频显示,该影城的电子显示屏上滚动播放显示:“为支持《哪吒之魔童闹海》,本影城暂不考虑《美国队长4》的排片。望各位影迷理解。我们的国漫值得被世界看见。”记者查询发现,该影城共有3个影厅,其中《哪吒之魔童闹海》每天放映场次高达11场,占据其中2个影厅的主要排片时间,另外一个影厅则主要播放其余三部国产影片。截至2月16日18时30分,《哪吒之魔童闹海》累计票房(含预售及海外票房)已超118.15亿元,成为首部进入全球票房榜前11的亚洲电影,距离全球影视票房榜第10名只差约2.36亿元。九派新闻记者 闫华阳编辑 肖洁

取消
网站地图