From patchwork Fri Nov  8 16:10:17 2024
Content-Type: text/plain; charset="utf-8"
MIME-Version: 1.0
Content-Transfer-Encoding: 7bit
X-Patchwork-Submitter: Claudio Bantaloukas <claudio.bantaloukas@arm.com>
X-Patchwork-Id: 2008631
Return-Path: <gcc-patches-bounces~incoming=patchwork.ozlabs.org@gcc.gnu.org>
X-Original-To: incoming@patchwork.ozlabs.org
Delivered-To: patchwork-incoming@legolas.ozlabs.org
Authentication-Results: legolas.ozlabs.org;
	dkim=pass (1024-bit key;
 unprotected) header.d=arm.com header.i=@arm.com header.a=rsa-sha256
 header.s=selector1 header.b=KGgBqW2C;
	dkim=pass (1024-bit key) header.d=arm.com header.i=@arm.com
 header.a=rsa-sha256 header.s=selector1 header.b=KGgBqW2C;
	dkim-atps=neutral
Authentication-Results: legolas.ozlabs.org;
 spf=pass (sender SPF authorized) smtp.mailfrom=gcc.gnu.org
 (client-ip=8.43.85.97; helo=server2.sourceware.org;
 envelope-from=gcc-patches-bounces~incoming=patchwork.ozlabs.org@gcc.gnu.org;
 receiver=patchwork.ozlabs.org)
Received: from server2.sourceware.org (server2.sourceware.org [8.43.85.97])
	(using TLSv1.3 with cipher TLS_AES_256_GCM_SHA384 (256/256 bits)
	 key-exchange X25519 server-signature ECDSA (secp384r1) server-digest SHA384)
	(No client certificate requested)
	by legolas.ozlabs.org (Postfix) with ESMTPS id 4XlP7n0h28z1xyM
	for <incoming@patchwork.ozlabs.org>; Sat,  9 Nov 2024 03:11:16 +1100 (AEDT)
Received: from server2.sourceware.org (localhost [IPv6:::1])
	by sourceware.org (Postfix) with ESMTP id DB9623858427
	for <incoming@patchwork.ozlabs.org>; Fri,  8 Nov 2024 16:11:14 +0000 (GMT)
X-Original-To: gcc-patches@gcc.gnu.org
Delivered-To: gcc-patches@gcc.gnu.org
Received: from EUR05-AM6-obe.outbound.protection.outlook.com
 (mail-am6eur05on20628.outbound.protection.outlook.com
 [IPv6:2a01:111:f403:2612::628])
 by sourceware.org (Postfix) with ESMTPS id 0D8743858D20
 for <gcc-patches@gcc.gnu.org>; Fri,  8 Nov 2024 16:10:40 +0000 (GMT)
DMARC-Filter: OpenDMARC Filter v1.4.2 sourceware.org 0D8743858D20
Authentication-Results: sourceware.org;
 dmarc=pass (p=none dis=none) header.from=arm.com
Authentication-Results: sourceware.org; spf=pass smtp.mailfrom=arm.com
ARC-Filter: OpenARC Filter v1.0.0 sourceware.org 0D8743858D20
Authentication-Results: server2.sourceware.org;
 arc=pass smtp.remote-ip=2a01:111:f403:2612::628
ARC-Seal: i=3; a=rsa-sha256; d=sourceware.org; s=key; t=1731082243; cv=pass;
 b=igRC9OaaO6UBbeFBRSQ22UKfxWz8Tw3RyggzsEwz/nPta+BIVvbkQxXuCNshnYh7YlKsR8YW1cB9sckYXZ60n1FsZAHSpp5wCBWbq+0UWz76WzAfqCD19JE3zj4vINq41Zn0U030pKljaetL552Cid0yslBM2tOQ6mjxgUEY6v4=
ARC-Message-Signature: i=3; a=rsa-sha256; d=sourceware.org; s=key;
 t=1731082243; c=relaxed/simple;
 bh=9TZsbHXYPeFW4RseSn7KBYjYNXc3ExoAouT7k3ZOtvU=;
 h=DKIM-Signature:DKIM-Signature:From:To:Subject:Date:Message-ID:
 MIME-Version;
 b=YYISfXyZL8N5aBy0EtY6td0CEhgV/IUSwtPL/NqpjBBMPw0bzPXv/SvLHw7Ih1p90x7wNtovxHedQaV5zs2Sv3XAvziKSY9XOROwRv0nDc+PY2XnFECByS1/jtqLqoPSQqHzpzJfTN8jYJc9KqX/ejghMX7dDWiUS/Neq+h5RRY=
ARC-Authentication-Results: i=3; server2.sourceware.org
ARC-Seal: i=2; a=rsa-sha256; s=arcselector10001; d=microsoft.com; cv=pass;
 b=G5f4wGESky2ttooEVtnz2gwXEQdpFfAYF6E0oujWG71jW/03/i2wbdmmqIUqzuSBsgfu/43UewTKEdAEKbOqdvlUcseh10MidQ3k3ZiOcuhO+ACIWj45Ii8QAx9NJStBL00zz56SRsfNHK6PfJzShD2QkeI+cFMs9u2s5BTAMC6tVEOMG93v20LhJMu51eZRtH3k70nfx8O9ZMm0fF6h09S0L5P0S42ecHo5GifVW9+LWKHhE8m/j6vRHBjXEx9up7XN0uvXb0fCrMgVOwu49snFhK+N8Qw+r2Tg7q3PZgwdCA4sPk1amLLdKcLryE0FfsclNs7kWTt2nRd46KQu7w==
ARC-Message-Signature: i=2; a=rsa-sha256; c=relaxed/relaxed; d=microsoft.com;
 s=arcselector10001;
 h=From:Date:Subject:Message-ID:Content-Type:MIME-Version:X-MS-Exchange-AntiSpam-MessageData-ChunkCount:X-MS-Exchange-AntiSpam-MessageData-0:X-MS-Exchange-AntiSpam-MessageData-1;
 bh=cG9EAqadKrwM3r4GFXkuHWXOskrdl2HCZixI/dEt4kE=;
 b=wYPCghwapiod9mQHCjn41zs7gh8mo1viPbngt05urRd6Hp57vxJgoBqGukT27i5iF7+aim/i/dnumrmojIkVNvwwc9RHTVTef9iB5NNCm9Li27oSXJdR2ADABCXy8ZYpizs4FHTFz6j6NA+bZMhcIYhfT53OtkkPO59/YIcP5kiZIk6jHV2j0fVZL7yfvRuHYuGowRT97XC17m81MEQ0PaSooWHOxz5TVG7asKIu8DK28sGCGar2pNMyRSpdyLlDGYuo3G3KcAa5TyliyffeozfdTeEi9q40f1Ha8zsDZxVBm0vUTAaQd52zYbvBvYHq9G/So3qD96eXCtlOaVaCpQ==
ARC-Authentication-Results: i=2; mx.microsoft.com 1; spf=pass (sender ip is
 63.35.35.123) smtp.rcpttodomain=gcc.gnu.org smtp.mailfrom=arm.com; dmarc=pass
 (p=none sp=none pct=100) action=none header.from=arm.com; dkim=pass
 (signature was verified) header.d=arm.com; arc=pass (0 oda=1 ltdi=1
 spf=[1,1,smtp.mailfrom=arm.com] dmarc=[1,1,header.from=arm.com])
DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=arm.com; s=selector1;
 h=From:Date:Subject:Message-ID:Content-Type:MIME-Version:X-MS-Exchange-SenderADCheck;
 bh=cG9EAqadKrwM3r4GFXkuHWXOskrdl2HCZixI/dEt4kE=;
 b=KGgBqW2Cg8VK3f4xzReCl2umrBMQgCp58YTl1+/MLMk0XWsJ8CN6An8wxOnKFoXZZwvi8RFBzd6M+cI+zozQvkZoT4hxhwr+axJd+sPODUFp2xUmvXtE+/tWMYgOLOQJp2r8snDFgnU9G8GMXQ7T8bXVyDOWUDo6XFluvvzRH+I=
Received: from AM4PR05CA0015.eurprd05.prod.outlook.com (2603:10a6:205::28) by
 DBAPR08MB5560.eurprd08.prod.outlook.com (2603:10a6:10:1ac::23) with
 Microsoft
 SMTP Server (version=TLS1_2, cipher=TLS_ECDHE_RSA_WITH_AES_256_GCM_SHA384) id
 15.20.8137.19; Fri, 8 Nov 2024 16:10:35 +0000
Received: from AMS0EPF000001A3.eurprd05.prod.outlook.com
 (2603:10a6:205:0:cafe::aa) by AM4PR05CA0015.outlook.office365.com
 (2603:10a6:205::28) with Microsoft SMTP Server (version=TLS1_2,
 cipher=TLS_ECDHE_RSA_WITH_AES_256_GCM_SHA384) id 15.20.8137.20 via Frontend
 Transport; Fri, 8 Nov 2024 16:10:35 +0000
X-MS-Exchange-Authentication-Results: spf=pass (sender IP is 63.35.35.123)
 smtp.mailfrom=arm.com; dkim=pass (signature was verified)
 header.d=arm.com;dmarc=pass action=none header.from=arm.com;
Received-SPF: Pass (protection.outlook.com: domain of arm.com designates
 63.35.35.123 as permitted sender) receiver=protection.outlook.com;
 client-ip=63.35.35.123; helo=64aa7808-outbound-1.mta.getcheckrecipient.com;
 pr=C
Received: from 64aa7808-outbound-1.mta.getcheckrecipient.com (63.35.35.123) by
 AMS0EPF000001A3.mail.protection.outlook.com (10.167.16.228) with
 Microsoft
 SMTP Server (version=TLS1_3, cipher=TLS_AES_256_GCM_SHA384) id 15.20.8137.17
 via Frontend Transport; Fri, 8 Nov 2024 16:10:35 +0000
Received: ("Tessian outbound b64574585bf8:v490");
 Fri, 08 Nov 2024 16:10:35 +0000
X-CheckRecipientChecked: true
X-CR-MTA-CID: 52da0d86d5fae6ae
X-TessianGatewayMetadata: 
 +FrtA5tsNVQLGFt+nevDgVIr6r17wAP84u+B88afYBanG3LjeoXqOFl3vuYe5cfqrH6N+Cr6ZehNeqI2lL0tOm/mLu9tTblr/BLiEM8b37YUTj3VMaq/OWvwAoRw7BnArzwoNHwWJ14KFP1zC0WPyGHNs1GkjNkWAzMKgRLytIA=
X-CR-MTA-TID: 64aa7808
Received: from L1370e0219e0c.1
 by 64aa7808-outbound-1.mta.getcheckrecipient.com id
 7C83BADA-ADF8-4108-BC8C-BCDE50CBAFE9.1;
 Fri, 08 Nov 2024 16:10:29 +0000
Received: from EUR03-VI1-obe.outbound.protection.outlook.com
 by 64aa7808-outbound-1.mta.getcheckrecipient.com with ESMTPS id
 L1370e0219e0c.1 (version=TLSv1.3 cipher=TLS_AES_256_GCM_SHA384);
 Fri, 08 Nov 2024 16:10:29 +0000
ARC-Seal: i=1; a=rsa-sha256; s=arcselector10001; d=microsoft.com; cv=none;
 b=sXyCtKHqdPgJg3MaYqqreRX1b41/gTTg+224DTAf/PYR/Gbee4Nc7E3MzC4stNezQrbFbkR9qddCYu2WYRRxpunZMGnFRPci4WZ4wyFN1bMTOgKCS4rrsYIepX8reElT1qpwWMeIJJu3dsBvNEU9Od8pAQpgV7U1lr/pcTsfj2gfwNtxIAH3u1D5HyXS8jI25gfnFOUbqGk5MFBFaPWkxp2O9GsbesPL6SWCf87wMSR23rq6gab3DVD7EiN5Mbqe8BpMt1qtcgpi8WFZCNtu/l1YmDUJ9bJ2KMJbGNk1LTfklQN16YcB/gB0jazG0cXP9hRZ5jB4Jxg4CE138XqQWg==
ARC-Message-Signature: i=1; a=rsa-sha256; c=relaxed/relaxed; d=microsoft.com;
 s=arcselector10001;
 h=From:Date:Subject:Message-ID:Content-Type:MIME-Version:X-MS-Exchange-AntiSpam-MessageData-ChunkCount:X-MS-Exchange-AntiSpam-MessageData-0:X-MS-Exchange-AntiSpam-MessageData-1;
 bh=cG9EAqadKrwM3r4GFXkuHWXOskrdl2HCZixI/dEt4kE=;
 b=fBRd1xi/iupnMnfi/7vas0go9px4NSoE2wvDIA8NI94wBvHlu5iP6yXy+efGMQqlJlruLcoTutxdpOUUhneWX8rVrO4Xp0t6/S+c41h3VbSbc9e4s91jeGC1RgqkRdKQ8wxe1U/DkBjUGLGFQTZtc9RSeZ+K/e8zNqu/iEV+KtDlpk2Hac82bPHNFN8Z3L5t4Gzo8WffPXjiA6bUNyFQN8+4He+1z6mRKMSXrVrjn1IPUaYpVj5jncIvdAidUjtY78Z+x8zV7+K6AYWY6QVawjRZwD46xKyTUnuJIU1OVgxzzdVbp3DWZSzNf66a9YJMtTfATStzSstDrfY3X9zUhg==
ARC-Authentication-Results: i=1; mx.microsoft.com 1; spf=pass (sender ip is
 40.67.248.234) smtp.rcpttodomain=gcc.gnu.org smtp.mailfrom=arm.com;
 dmarc=pass (p=none sp=none pct=100) action=none header.from=arm.com;
 dkim=none (message not signed); arc=none (0)
DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=arm.com; s=selector1;
 h=From:Date:Subject:Message-ID:Content-Type:MIME-Version:X-MS-Exchange-SenderADCheck;
 bh=cG9EAqadKrwM3r4GFXkuHWXOskrdl2HCZixI/dEt4kE=;
 b=KGgBqW2Cg8VK3f4xzReCl2umrBMQgCp58YTl1+/MLMk0XWsJ8CN6An8wxOnKFoXZZwvi8RFBzd6M+cI+zozQvkZoT4hxhwr+axJd+sPODUFp2xUmvXtE+/tWMYgOLOQJp2r8snDFgnU9G8GMXQ7T8bXVyDOWUDo6XFluvvzRH+I=
Received: from AM6PR01CA0072.eurprd01.prod.exchangelabs.com
 (2603:10a6:20b:e0::49) by AS8PR08MB8394.eurprd08.prod.outlook.com
 (2603:10a6:20b:568::5) with Microsoft SMTP Server (version=TLS1_2,
 cipher=TLS_ECDHE_RSA_WITH_AES_256_GCM_SHA384) id 15.20.8137.19; Fri, 8 Nov
 2024 16:10:25 +0000
Received: from AMS0EPF000001B6.eurprd05.prod.outlook.com
 (2603:10a6:20b:e0:cafe::7a) by AM6PR01CA0072.outlook.office365.com
 (2603:10a6:20b:e0::49) with Microsoft SMTP Server (version=TLS1_2,
 cipher=TLS_ECDHE_RSA_WITH_AES_256_GCM_SHA384) id 15.20.8137.21 via Frontend
 Transport; Fri, 8 Nov 2024 16:10:25 +0000
X-MS-Exchange-Authentication-Results: spf=pass (sender IP is 40.67.248.234)
 smtp.mailfrom=arm.com; dkim=none (message not signed)
 header.d=none;dmarc=pass action=none header.from=arm.com;
Received-SPF: Pass (protection.outlook.com: domain of arm.com designates
 40.67.248.234 as permitted sender) receiver=protection.outlook.com;
 client-ip=40.67.248.234; helo=nebula.arm.com; pr=C
Received: from nebula.arm.com (40.67.248.234) by
 AMS0EPF000001B6.mail.protection.outlook.com (10.167.16.170) with Microsoft
 SMTP Server (version=TLS1_2, cipher=TLS_ECDHE_RSA_WITH_AES_128_GCM_SHA256) id
 15.20.8137.17 via Frontend Transport; Fri, 8 Nov 2024 16:10:25 +0000
Received: from AZ-NEU-EXJ01.Arm.com (10.240.25.132) by AZ-NEU-EX04.Arm.com
 (10.251.24.32) with Microsoft SMTP Server (version=TLS1_2,
 cipher=TLS_ECDHE_RSA_WITH_AES_128_GCM_SHA256) id 15.1.2507.39; Fri, 8 Nov
 2024 16:10:25 +0000
Received: from AZ-NEU-EX04.Arm.com (10.251.24.32) by AZ-NEU-EXJ01.Arm.com
 (10.240.25.132) with Microsoft SMTP Server (version=TLS1_2,
 cipher=TLS_ECDHE_RSA_WITH_AES_128_GCM_SHA256) id 15.1.2507.39; Fri, 8 Nov
 2024 16:10:24 +0000
Received: from 221664dbf3aa.euhpc2.arm.com (10.58.86.32) by mail.arm.com
 (10.251.24.32) with Microsoft SMTP Server id 15.1.2507.39 via Frontend
 Transport; Fri, 8 Nov 2024 16:10:24 +0000
From: Claudio Bantaloukas <claudio.bantaloukas@arm.com>
To: <gcc-patches@gcc.gnu.org>
CC: Claudio Bantaloukas <claudio.bantaloukas@arm.com>
Subject: [PATCH v2 1/4] aarch64: return scalar fp8 values in fp registers
Date: Fri, 8 Nov 2024 16:10:17 +0000
Message-ID: <20241108161020.921071-2-claudio.bantaloukas@arm.com>
X-Mailer: git-send-email 2.43.0
In-Reply-To: <20241108161020.921071-1-claudio.bantaloukas@arm.com>
References: <20241108161020.921071-1-claudio.bantaloukas@arm.com>
MIME-Version: 1.0
X-EOPAttributedMessage: 1
X-MS-TrafficTypeDiagnostic: 
 AMS0EPF000001B6:EE_|AS8PR08MB8394:EE_|AMS0EPF000001A3:EE_|DBAPR08MB5560:EE_
X-MS-Office365-Filtering-Correlation-Id: ae1f8f0b-897e-4da9-2432-08dd000fe0fd
x-checkrecipientrouted: true
NoDisclaimer: true
X-MS-Exchange-SenderADCheck: 1
X-MS-Exchange-AntiSpam-Relay: 0
X-Microsoft-Antispam-Untrusted: BCL:0;
 ARA:13230040|82310400026|376014|1800799024|36860700013;
X-Microsoft-Antispam-Message-Info-Original: 
 Ot5jjcKsSuhQXAOj3DhqUPdgs3nf3Cq/t43sVz1iIJu/I2EAwPEYUfQ1VQu75CLJ9AD0+6tmLy0f/XDI99sRowA7TP8+EDwCdSVBWOt/hjvEW4fye2ag6T4TLI3MehTetDCJIp+Cx4Jssrvzp7FZ4IB8FPmQ0tWMNqKmnLJKXZL0/RMcPAc9l/QBVmVUQRIulN/jU/0lCQkMvqRPsAN1mVuG2UB43xo+JDXtP5AurDOpUwXVHA7jHn/8VHSGYTfIzGC8R7b9a3irB6EooU+GOXz5E0Nk8HtVZZKqJjYDKT8ki2u/glIewIjNQoBHCaJlnb/Z20rYt/QKXZ9HlbspYTtQz2XzlyrW5RtNzqKZ23Dmoe57OkpHDZhCzV3l/KEwsWmobRBuRhMUcX3Ijo84aREjCDUakeUOHXJhu06yrkohvHHIg/ILUocU+lx10Vi/CTvo1htpf6o9qji/6zx9a+aeUS5e5PTzvz5+HyQlJty5xs6+NVqtypWJTsGCh08d7UFHsgUoKue1jkF0fe5rO0m4voCUplKMFXiZS5A4NksBaEQqDlM8Fmmyhm0PULJUaF4o0pzH0ooP4LYbUXUKBNbXQgTq6CGfiEwP/BHAF0BiEL7f7L0uHt7Owp6Zq0T7TQ+Cc4smzxJONv9GMEBrFgd55c0ihBBHFt9lPlbX7quOzIEwTFyQwyR49V0kS5d8G4cOKfU2ciVHe9bg88nz5SxlM/7aUtsQ92KdBBIxm2KNfntJMPZvxv+J1r/QY0UXvt4SX8vV20cbfSJ+bzhM37x/i46MM4AtmwOoMvh/HMQ1DzJbuuykeISpzyIfqtQFzj0F0hOtORZuTyDH5stzT68F671ahLjP1yIyhZFUJZEeqcHo6sGeUyIj8HqrYJaSJs9UXUGlul0FrBr2m+LF5eiaqw8sClfjI/fLnbKpd9U0R0iPnAnKYaR7p3r1MzlBGv9tKnnRtGCiahunaZhyfh+uEY0L9KrskcOgcTCwG0g0Vw2C0xY+efxkQ7eBwKMUXxdd12eXRVGknQ3x8xjHCD/+k3ckeH878j27ZAbY8GR/vNjsdtyGuOf6kl/HuI7I+H8IugB8VBWvnTT2u/1Po+q/P59pKhk+ITQGMqzITCaI6rnX9Tq5+HnjvEkIydE0RP0pYOk7l1nOmSKu0xKMhwGQu+ckJIDhxIinK7YHocvUEZr1/pcTd6XGM5WsoxEDscWPyXBrvRPidO1g70ErjTh0gFCKNZMM8UPzhKttTb6PS/eZKfX4y2nrdSBrZHOZYdP3O6kxj43ySkPjd/e8FC5u46NqPuDfOSyn/udIgAZEIufQCynLTZvR/34fAd78EucMxMYl8QiY6xLtj9wSONLeaRe7NNDr5YJ83hfiIic=
X-Forefront-Antispam-Report-Untrusted: CIP:40.67.248.234; CTRY:IE; LANG:en;
 SCL:1; SRV:; IPV:NLI; SFV:NSPM; H:nebula.arm.com; PTR:InfoDomainNonexistent;
 CAT:NONE; SFS:(13230040)(82310400026)(376014)(1800799024)(36860700013);
 DIR:OUT; SFP:1101;
X-MS-Exchange-Transport-CrossTenantHeadersStamped: AS8PR08MB8394
X-MS-Exchange-SkipListedInternetSender: ip=[2603:10a6:20b:e0::49];
 domain=AM6PR01CA0072.eurprd01.prod.exchangelabs.com
X-MS-Exchange-Transport-CrossTenantHeadersStripped: 
 AMS0EPF000001A3.eurprd05.prod.outlook.com
X-MS-PublicTrafficType: Email
X-MS-Office365-Filtering-Correlation-Id-Prvs: 
 b7b2962d-e8fb-4488-7ace-08dd000fdb04
X-Microsoft-Antispam: BCL:0;
 ARA:13230040|1800799024|376014|14060799003|82310400026|36860700013|35042699022;
X-Microsoft-Antispam-Message-Info: =?utf-8?q?cyTzLtxdjiCDwtjWwgMdMPYDqH4MNkT?=
	=?utf-8?q?MQu98GSOPIqEjLP4IPE9KYt+vrhCRO8o0UNcfllUVAEanpuZ9+A/7B8idzCixtLt4?=
	=?utf-8?q?PzG0e5cpCLsvOCcJRZik5ddlPpNS/d9uta86gpUZpz5f3XjPzV/HHtBeaPrUa46ca?=
	=?utf-8?q?GczKINQ60GQ6jSQNufN+y1M02Z1zf27nCxDFWQqt9+Pc+dYUaAApZ2d9z23EqQj8t?=
	=?utf-8?q?D8/kioINUlfZ5psWXN+Jj1/rxxSTV5vS79cZ1+x3SvZYQ4/txZtXK1JPfkxbsW7q/?=
	=?utf-8?q?XZuVaVqq54mgzlHf/goFlBZhRgTUXN7aFTC9LFPMnSDOSzf2SVEH8xa3VR5afVSVB?=
	=?utf-8?q?G4lP/8SOYBIJtnuW3XJiib88a2nkZndk2eFoBG4JveJLB/F/6J/gaTr9WX0wPC2h5?=
	=?utf-8?q?QzN9fT/EAURSaBp/zFMxIrnnTm2yu45aQyLcWxghNVOTO/eW5QVqwBH0bhehrU/bK?=
	=?utf-8?q?OGQhSz6xEJ2RXjspXypHUwsfSmCaNcueb/sBzdPb0M7QsqtEPC9hWY5E9vBzIu52j?=
	=?utf-8?q?vMFSSINqOY0SHJlzJsNM0wLR/vK/ai7YW7ivSxdYQdhYessz4x/blyDeqG9U7G5ub?=
	=?utf-8?q?0XGU51vLmG8tepw7aUW2FCua7B+mhASmuTkCZPKV2qLadWhrPYPH/1orWsOQq828U?=
	=?utf-8?q?W9CcunSxUbsLIu9aRNjOFAxBKuG+lNcmpLJ69MXTLV8UB9ft31pfIC2CcdViBHWov?=
	=?utf-8?q?361uwLIH2TK+znDhRTVBtAZvgDrRFIe88pikd67DkR8OSr+wdB7JC1bs5Be24EZLc?=
	=?utf-8?q?lognpsZT6fY1wntljja9liwgmGJAFuNbIzy/JYi9ffMruP/Kkryy7I7DLB7GsPAzb?=
	=?utf-8?q?HGjfaYbFhYUa6z9XrbzAFEKk7fGCUcGLDXMdgSrJREAh6d8c5HOqu31zHOQA7Lxcr?=
	=?utf-8?q?RE5aiCnVga5SDQX+h1yGXZKITtso9+m2jHNENWQ3potVB1TCS8NrtdWrDBwitJkbN?=
	=?utf-8?q?Bw1HtMbhKN9DMIt12wBaOOr0nJf7+7GirZGADfBr+ssLX0aQ8PmBEkUdCpLVQQzdl?=
	=?utf-8?q?Ljwvi0OZs21S6s9dmPm2F3PdeDaiGStP07xGvrBh8X/yLXFHZOjBeaaGW4trFA3yd?=
	=?utf-8?q?aeyzL8oXsYp8/11Br/nTUt2FWnETiz3H4hennvUcDvfdEq0jbdb9fs9b8BGTqwk8r?=
	=?utf-8?q?Nxsf5K3sZMkxgjl3b3bC2CIniCiPBzxF/RVMDaVFhfCLoez7kGx+csPR59vhmrQd+?=
	=?utf-8?q?HljZB66dJ/PSi0SpYDMUNHXcM4WMaE5xbn0PcVTr1E8ifXdIjv3O0ZdphdqRo9S6Z?=
	=?utf-8?q?5IE83KVq7VXqGLzZKTAF+xRQq183C1f1JbYEKbYYvfD3FQF6ygkNLLlc=3D?=
X-Forefront-Antispam-Report: CIP:63.35.35.123; CTRY:IE; LANG:en; SCL:1; SRV:;
 IPV:CAL; SFV:NSPM; H:64aa7808-outbound-1.mta.getcheckrecipient.com;
 PTR:ec2-63-35-35-123.eu-west-1.compute.amazonaws.com; CAT:NONE;
 SFS:(13230040)(1800799024)(376014)(14060799003)(82310400026)(36860700013)(35042699022);
 DIR:OUT; SFP:1101;
X-OriginatorOrg: arm.com
X-MS-Exchange-CrossTenant-OriginalArrivalTime: 08 Nov 2024 16:10:35.5049 (UTC)
X-MS-Exchange-CrossTenant-Network-Message-Id: 
 ae1f8f0b-897e-4da9-2432-08dd000fe0fd
X-MS-Exchange-CrossTenant-Id: f34e5979-57d9-4aaa-ad4d-b122a662184d
X-MS-Exchange-CrossTenant-OriginalAttributedTenantConnectingIp: 
 TenantId=f34e5979-57d9-4aaa-ad4d-b122a662184d; Ip=[63.35.35.123];
 Helo=[64aa7808-outbound-1.mta.getcheckrecipient.com]
X-MS-Exchange-CrossTenant-AuthSource: 
 AMS0EPF000001A3.eurprd05.prod.outlook.com
X-MS-Exchange-CrossTenant-AuthAs: Anonymous
X-MS-Exchange-CrossTenant-FromEntityHeader: HybridOnPrem
X-MS-Exchange-Transport-CrossTenantHeadersStamped: DBAPR08MB5560
X-BeenThere: gcc-patches@gcc.gnu.org
X-Mailman-Version: 2.1.30
Precedence: list
List-Id: Gcc-patches mailing list <gcc-patches.gcc.gnu.org>
List-Unsubscribe: <https://gcc.gnu.org/mailman/options/gcc-patches>,
 <mailto:gcc-patches-request@gcc.gnu.org?subject=unsubscribe>
List-Archive: <https://gcc.gnu.org/pipermail/gcc-patches/>
List-Post: <mailto:gcc-patches@gcc.gnu.org>
List-Help: <mailto:gcc-patches-request@gcc.gnu.org?subject=help>
List-Subscribe: <https://gcc.gnu.org/mailman/listinfo/gcc-patches>,
 <mailto:gcc-patches-request@gcc.gnu.org?subject=subscribe>
Errors-To: gcc-patches-bounces~incoming=patchwork.ozlabs.org@gcc.gnu.org

According to the aapcs64: If the argument is an 8-bit (...) precision
Floating-point or short vector type and the NSRN is less than 8, then the
argument is allocated to the least significant bits of register v[NSRN].

gcc/
	* config/aarch64/aarch64.cc
	(aarch64_vfp_is_call_or_return_candidate): use fp registers to
	return svmfloat8_t parameters.

gcc/testsuite/
	* gcc.target/aarch64/fp8_scalar_1.c:
---
 gcc/config/aarch64/aarch64.cc                   | 3 ++-
 gcc/testsuite/gcc.target/aarch64/fp8_scalar_1.c | 4 ++--
 2 files changed, 4 insertions(+), 3 deletions(-)

diff --git a/gcc/config/aarch64/aarch64.cc b/gcc/config/aarch64/aarch64.cc
index f2b53475adb..0e2f9ef0ca1 100644
--- a/gcc/config/aarch64/aarch64.cc
+++ b/gcc/config/aarch64/aarch64.cc
@@ -22276,7 +22276,8 @@ aarch64_vfp_is_call_or_return_candidate (machine_mode mode,
 
   if ((!composite_p
        && (GET_MODE_CLASS (mode) == MODE_FLOAT
-	   || GET_MODE_CLASS (mode) == MODE_DECIMAL_FLOAT))
+	   || GET_MODE_CLASS (mode) == MODE_DECIMAL_FLOAT
+	   || (type && TYPE_MAIN_VARIANT (type) == aarch64_mfp8_type_node)))
       || aarch64_short_vector_p (type, mode))
     {
       *count = 1;
diff --git a/gcc/testsuite/gcc.target/aarch64/fp8_scalar_1.c b/gcc/testsuite/gcc.target/aarch64/fp8_scalar_1.c
index 1bc2ac26b2a..61edf06401b 100644
--- a/gcc/testsuite/gcc.target/aarch64/fp8_scalar_1.c
+++ b/gcc/testsuite/gcc.target/aarch64/fp8_scalar_1.c
@@ -7,10 +7,10 @@
 
 /*
 **stacktest1:
+**	umov	w0, v0.b\[0\]
 **	sub	sp, sp, #16
-**	and	w0, w0, 255
 **	strb	w0, \[sp, 15\]
-**	ldrb	w0, \[sp, 15\]
+**	ldr	b0, \[sp, 15\]
 **	add	sp, sp, 16
 **	ret
 */

From patchwork Fri Nov  8 16:10:18 2024
Content-Type: text/plain; charset="utf-8"
MIME-Version: 1.0
Content-Transfer-Encoding: 7bit
X-Patchwork-Submitter: Claudio Bantaloukas <claudio.bantaloukas@arm.com>
X-Patchwork-Id: 2008632
Return-Path: <gcc-patches-bounces~incoming=patchwork.ozlabs.org@gcc.gnu.org>
X-Original-To: incoming@patchwork.ozlabs.org
Delivered-To: patchwork-incoming@legolas.ozlabs.org
Authentication-Results: legolas.ozlabs.org;
	dkim=pass (1024-bit key;
 unprotected) header.d=arm.com header.i=@arm.com header.a=rsa-sha256
 header.s=selector1 header.b=mjSXqeh1;
	dkim=pass (1024-bit key) header.d=arm.com header.i=@arm.com
 header.a=rsa-sha256 header.s=selector1 header.b=mjSXqeh1;
	dkim-atps=neutral
Authentication-Results: legolas.ozlabs.org;
 spf=pass (sender SPF authorized) smtp.mailfrom=gcc.gnu.org
 (client-ip=2620:52:3:1:0:246e:9693:128c; helo=server2.sourceware.org;
 envelope-from=gcc-patches-bounces~incoming=patchwork.ozlabs.org@gcc.gnu.org;
 receiver=patchwork.ozlabs.org)
Received: from server2.sourceware.org (server2.sourceware.org
 [IPv6:2620:52:3:1:0:246e:9693:128c])
	(using TLSv1.3 with cipher TLS_AES_256_GCM_SHA384 (256/256 bits)
	 key-exchange X25519 server-signature ECDSA (secp384r1) server-digest SHA384)
	(No client certificate requested)
	by legolas.ozlabs.org (Postfix) with ESMTPS id 4XlP8f4kn5z1xyM
	for <incoming@patchwork.ozlabs.org>; Sat,  9 Nov 2024 03:12:02 +1100 (AEDT)
Received: from server2.sourceware.org (localhost [IPv6:::1])
	by sourceware.org (Postfix) with ESMTP id BD7A93858019
	for <incoming@patchwork.ozlabs.org>; Fri,  8 Nov 2024 16:12:00 +0000 (GMT)
X-Original-To: gcc-patches@gcc.gnu.org
Delivered-To: gcc-patches@gcc.gnu.org
Received: from EUR05-DB8-obe.outbound.protection.outlook.com
 (mail-db8eur05on20611.outbound.protection.outlook.com
 [IPv6:2a01:111:f403:2614::611])
 by sourceware.org (Postfix) with ESMTPS id D9E9E3858D20
 for <gcc-patches@gcc.gnu.org>; Fri,  8 Nov 2024 16:10:51 +0000 (GMT)
DMARC-Filter: OpenDMARC Filter v1.4.2 sourceware.org D9E9E3858D20
Authentication-Results: sourceware.org;
 dmarc=pass (p=none dis=none) header.from=arm.com
Authentication-Results: sourceware.org; spf=pass smtp.mailfrom=arm.com
ARC-Filter: OpenARC Filter v1.0.0 sourceware.org D9E9E3858D20
Authentication-Results: server2.sourceware.org;
 arc=pass smtp.remote-ip=2a01:111:f403:2614::611
ARC-Seal: i=3; a=rsa-sha256; d=sourceware.org; s=key; t=1731082264; cv=pass;
 b=pealSN+eviFWJD8H1h489K1eWCEAfi98Tj4P57IVjI/RC2hGKHJTv1lKKBVmlhglJGPXz/DZkd/NgSSDpUQNqVRJDZ6hWp0buwyegKdXK47HrYJWsqmp4uHqhQINxooU27a1h86bMBPBTXw3eBieCtDd/PYb2RY7xoY1MsXNtG4=
ARC-Message-Signature: i=3; a=rsa-sha256; d=sourceware.org; s=key;
 t=1731082264; c=relaxed/simple;
 bh=LpuKbuSGk+Zah4guAIqxCGtBWBxQBGMOVdiTFqVOn+o=;
 h=DKIM-Signature:DKIM-Signature:From:To:Subject:Date:Message-ID:
 MIME-Version;
 b=PRC+aABUsHxqs22GgdxF7rOY5n/qlVp/DzSjThixXVf9u9iednXET3Ok+kuPY321pDK4mUE3cVJ+FX2xJ14X6ZQxGqEvN9nH1tJz6gMjj+im9V6DwXhgLFsWMWGQpRTTfHAsNS//I1BRsSMigVRQTrmqj8BjgGOCu7Db0AVKexo=
ARC-Authentication-Results: i=3; server2.sourceware.org
ARC-Seal: i=2; a=rsa-sha256; s=arcselector10001; d=microsoft.com; cv=pass;
 b=CHjR9Uctqgd/DrSnXw+zaHuULM4/UG69gDicmuWdH6U1iBM/6XJb7N9Y+Era0Gu0CQ96Cubbtn8bcxJBgNWCPDLf2n0tHoj8BwBDJavpbNm1AlvhEU3/k1bxpywpi/kRI6FKoRnXyETkdS0TzFKmgCFbr64InIvvXuzSNfHf6zJu4KZfAlunikFuC6tr4ZnMfZ6jqX1HGRGcy+nocUQWkQXK7AX00JziHTtO/ZCO4Ys1UPDm1s/xRf7qSDz1dScVii5ssU0cNmJeqWUWK0aIXvTY86g5JBP7VPtCnAkYiZxaab8BTpXCjxQRNSJz2tt+qkPKonYDrt2L3K544zOgYg==
ARC-Message-Signature: i=2; a=rsa-sha256; c=relaxed/relaxed; d=microsoft.com;
 s=arcselector10001;
 h=From:Date:Subject:Message-ID:Content-Type:MIME-Version:X-MS-Exchange-AntiSpam-MessageData-ChunkCount:X-MS-Exchange-AntiSpam-MessageData-0:X-MS-Exchange-AntiSpam-MessageData-1;
 bh=p+2+lvi62OnGV2U4cJrLLoEFBziGx2TLALQwLORIvVo=;
 b=BQdVxvA3WQB33xBw11G8q9x+wSa51Yx/bpJJWbcrD3z+Su+wJ83FM4GJpNE9JjAq+qWt5fn1sVCO1GHI3Htxy5alnfMEVmsDx1wqJO58wXbmF4/bVTO+S6NUfBwPzep3XfExr9h8U5FU4vjP7TcjYpimoSyRqxj9Dl3BU0a2u3Iu6iPCp/zlqS4aCGBBRxrJyUC5qkUU7UNrHIqTXi/rye1+RzuYdaDNd2g1roVE6OHU911Zu31hm87TEGkQYNY3oi0yd+3Tj/J7wiGvPSgvyafEHd2KFQmU7w7MM4nyGS4NhXNWs80EipmWe/Z3rNhSI3NoAFxu3v1tzztlK/cBlw==
ARC-Authentication-Results: i=2; mx.microsoft.com 1; spf=pass (sender ip is
 63.35.35.123) smtp.rcpttodomain=gcc.gnu.org smtp.mailfrom=arm.com; dmarc=pass
 (p=none sp=none pct=100) action=none header.from=arm.com; dkim=pass
 (signature was verified) header.d=arm.com; arc=pass (0 oda=1 ltdi=1
 spf=[1,1,smtp.mailfrom=arm.com] dmarc=[1,1,header.from=arm.com])
DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=arm.com; s=selector1;
 h=From:Date:Subject:Message-ID:Content-Type:MIME-Version:X-MS-Exchange-SenderADCheck;
 bh=p+2+lvi62OnGV2U4cJrLLoEFBziGx2TLALQwLORIvVo=;
 b=mjSXqeh1dqCipsI9tFGHj+Vb/HK1w4b0wNFdGywrQDbnobpoFuEQOWv2bX3lfU9XCt237MPQwhKPgra3Ax8Vydfg/uqR/P0ibfQD2BDaE4uRemuihokbuwtxlO/iFCQxDbPNPf6lDy/3bJ/udzIz27wZIwwbAKaFyLIXYEzBVIU=
Received: from AS4PR10CA0002.EURPRD10.PROD.OUTLOOK.COM (2603:10a6:20b:5dc::19)
 by VI0PR08MB10711.eurprd08.prod.outlook.com (2603:10a6:800:20c::18)
 with Microsoft SMTP Server (version=TLS1_2,
 cipher=TLS_ECDHE_RSA_WITH_AES_256_GCM_SHA384) id 15.20.8137.20; Fri, 8 Nov
 2024 16:10:40 +0000
Received: from AM1PEPF000252DD.eurprd07.prod.outlook.com
 (2603:10a6:20b:5dc:cafe::b9) by AS4PR10CA0002.outlook.office365.com
 (2603:10a6:20b:5dc::19) with Microsoft SMTP Server (version=TLS1_2,
 cipher=TLS_ECDHE_RSA_WITH_AES_256_GCM_SHA384) id 15.20.8137.21 via Frontend
 Transport; Fri, 8 Nov 2024 16:10:40 +0000
X-MS-Exchange-Authentication-Results: spf=pass (sender IP is 63.35.35.123)
 smtp.mailfrom=arm.com; dkim=pass (signature was verified)
 header.d=arm.com;dmarc=pass action=none header.from=arm.com;
Received-SPF: Pass (protection.outlook.com: domain of arm.com designates
 63.35.35.123 as permitted sender) receiver=protection.outlook.com;
 client-ip=63.35.35.123; helo=64aa7808-outbound-1.mta.getcheckrecipient.com;
 pr=C
Received: from 64aa7808-outbound-1.mta.getcheckrecipient.com (63.35.35.123) by
 AM1PEPF000252DD.mail.protection.outlook.com (10.167.16.55) with
 Microsoft
 SMTP Server (version=TLS1_3, cipher=TLS_AES_256_GCM_SHA384) id 15.20.8137.17
 via Frontend Transport; Fri, 8 Nov 2024 16:10:40 +0000
Received: ("Tessian outbound 6d1cdc6e2d10:v490");
 Fri, 08 Nov 2024 16:10:39 +0000
X-CheckRecipientChecked: true
X-CR-MTA-CID: 3783f1024eca56e5
X-TessianGatewayMetadata: 
 nVv3hk/dM3JRW1U/kMknd70+2flRekLWTFKFalKpLVO7D8NkfhY6EDYrsdi5sDqzFVAKqOC/Ocqt7A06341tAq31i2OQuwfc48z38Djlq2hnk0fT5Bikb/KFmNssy23PE5sUy7tQJ9HCjHeKgBLFExelmTn/L1XluY5pfBsLnFE=
X-CR-MTA-TID: 64aa7808
Received: from L4905d41dba1e.1
 by 64aa7808-outbound-1.mta.getcheckrecipient.com id
 5E0EC39E-2F8E-4946-8F44-EE4FA3E0076E.1;
 Fri, 08 Nov 2024 16:10:32 +0000
Received: from EUR05-DB8-obe.outbound.protection.outlook.com
 by 64aa7808-outbound-1.mta.getcheckrecipient.com with ESMTPS id
 L4905d41dba1e.1 (version=TLSv1.3 cipher=TLS_AES_256_GCM_SHA384);
 Fri, 08 Nov 2024 16:10:32 +0000
ARC-Seal: i=1; a=rsa-sha256; s=arcselector10001; d=microsoft.com; cv=none;
 b=H4O/K6rN31XGIgF035SPBrpYa6IPLGSqYrcEvWTViaFjOjSdx0SFTytlAohhP4ZymUr7C4j4sQNugo/ekNNPWV/V5jV9hn9YD5CpoHh7M8URvgiK+Q27j4KsZvLzsOKJHvET3MPFaL+miwA1a2JUPBSr6rd5Omj/yvsXzNOdIyO1R8H4TWPWzVWYVm53+TDOR5zKBUN5ZUdnOf9ibNET/90h82sRsobQL40TQMfdee7w1kEz9dZgnYHGYBbd5ckAPEZW6jj2D/Mh5/9dj0NW3OfpK4XrEgO4hj4Kh8hp23vjCAW8a5BD0thCWuwoQpBEPTJWRrwdjgKMmv3E5QAj6A==
ARC-Message-Signature: i=1; a=rsa-sha256; c=relaxed/relaxed; d=microsoft.com;
 s=arcselector10001;
 h=From:Date:Subject:Message-ID:Content-Type:MIME-Version:X-MS-Exchange-AntiSpam-MessageData-ChunkCount:X-MS-Exchange-AntiSpam-MessageData-0:X-MS-Exchange-AntiSpam-MessageData-1;
 bh=p+2+lvi62OnGV2U4cJrLLoEFBziGx2TLALQwLORIvVo=;
 b=DyMkwBe2ay5HlPkh/GPNRwJYD/B8FEgABKR97gmWIjrnsy/z/WWXgIrww0Y8QkXJ+VcbblWLwlJc2rWEJp4tYq0VatrEGjh42tcJjGAkcAf1IVZ7rAPnmMTLCpfWlwWafgSkyEqspLN8Gh9aMMCURGCIJkQISj5WYZ+Yz4J1hbNWap6xeB4SdTnJrA0knBoaLfkbpP4Xhx2KvBTGwnlArianY3dJiB7NaS/Cfc5NMoSHUnhIs2N+j8U6mpbViP+uhEAhQic3sSDMpzVR/hNBJDboVeYuWWQP022vlrwS4bK9nRGNbp9hcB7TqV4z6cIcgtMQCiZmMMqqLJXUjfMhPQ==
ARC-Authentication-Results: i=1; mx.microsoft.com 1; spf=pass (sender ip is
 40.67.248.234) smtp.rcpttodomain=gcc.gnu.org smtp.mailfrom=arm.com;
 dmarc=pass (p=none sp=none pct=100) action=none header.from=arm.com;
 dkim=none (message not signed); arc=none (0)
DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=arm.com; s=selector1;
 h=From:Date:Subject:Message-ID:Content-Type:MIME-Version:X-MS-Exchange-SenderADCheck;
 bh=p+2+lvi62OnGV2U4cJrLLoEFBziGx2TLALQwLORIvVo=;
 b=mjSXqeh1dqCipsI9tFGHj+Vb/HK1w4b0wNFdGywrQDbnobpoFuEQOWv2bX3lfU9XCt237MPQwhKPgra3Ax8Vydfg/uqR/P0ibfQD2BDaE4uRemuihokbuwtxlO/iFCQxDbPNPf6lDy/3bJ/udzIz27wZIwwbAKaFyLIXYEzBVIU=
Received: from AM6PR01CA0047.eurprd01.prod.exchangelabs.com
 (2603:10a6:20b:e0::24) by DB3PR08MB8843.eurprd08.prod.outlook.com
 (2603:10a6:10:438::17) with Microsoft SMTP Server (version=TLS1_2,
 cipher=TLS_ECDHE_RSA_WITH_AES_256_GCM_SHA384) id 15.20.8137.19; Fri, 8 Nov
 2024 16:10:26 +0000
Received: from AMS0EPF000001B6.eurprd05.prod.outlook.com
 (2603:10a6:20b:e0:cafe::44) by AM6PR01CA0047.outlook.office365.com
 (2603:10a6:20b:e0::24) with Microsoft SMTP Server (version=TLS1_2,
 cipher=TLS_ECDHE_RSA_WITH_AES_256_GCM_SHA384) id 15.20.8137.20 via Frontend
 Transport; Fri, 8 Nov 2024 16:10:26 +0000
X-MS-Exchange-Authentication-Results: spf=pass (sender IP is 40.67.248.234)
 smtp.mailfrom=arm.com; dkim=none (message not signed)
 header.d=none;dmarc=pass action=none header.from=arm.com;
Received-SPF: Pass (protection.outlook.com: domain of arm.com designates
 40.67.248.234 as permitted sender) receiver=protection.outlook.com;
 client-ip=40.67.248.234; helo=nebula.arm.com; pr=C
Received: from nebula.arm.com (40.67.248.234) by
 AMS0EPF000001B6.mail.protection.outlook.com (10.167.16.170) with Microsoft
 SMTP Server (version=TLS1_2, cipher=TLS_ECDHE_RSA_WITH_AES_128_GCM_SHA256) id
 15.20.8137.17 via Frontend Transport; Fri, 8 Nov 2024 16:10:26 +0000
Received: from AZ-NEU-EX02.Emea.Arm.com (10.251.26.5) by AZ-NEU-EX04.Arm.com
 (10.251.24.32) with Microsoft SMTP Server (version=TLS1_2,
 cipher=TLS_ECDHE_RSA_WITH_AES_128_GCM_SHA256) id 15.1.2507.39; Fri, 8 Nov
 2024 16:10:25 +0000
Received: from AZ-NEU-EX04.Arm.com (10.251.24.32) by AZ-NEU-EX02.Emea.Arm.com
 (10.251.26.5) with Microsoft SMTP Server (version=TLS1_2,
 cipher=TLS_ECDHE_RSA_WITH_AES_128_GCM_SHA256) id 15.1.2507.39; Fri, 8 Nov
 2024 16:10:25 +0000
Received: from 221664dbf3aa.euhpc2.arm.com (10.58.86.32) by mail.arm.com
 (10.251.24.32) with Microsoft SMTP Server id 15.1.2507.39 via Frontend
 Transport; Fri, 8 Nov 2024 16:10:25 +0000
From: Claudio Bantaloukas <claudio.bantaloukas@arm.com>
To: <gcc-patches@gcc.gnu.org>
CC: Claudio Bantaloukas <claudio.bantaloukas@arm.com>
Subject: [PATCH v2 2/4] aarch64: Add basic svmfloat8_t support to arm_sve.h
Date: Fri, 8 Nov 2024 16:10:18 +0000
Message-ID: <20241108161020.921071-3-claudio.bantaloukas@arm.com>
X-Mailer: git-send-email 2.43.0
In-Reply-To: <20241108161020.921071-1-claudio.bantaloukas@arm.com>
References: <20241108161020.921071-1-claudio.bantaloukas@arm.com>
MIME-Version: 1.0
X-EOPAttributedMessage: 1
X-MS-TrafficTypeDiagnostic: 
 AMS0EPF000001B6:EE_|DB3PR08MB8843:EE_|AM1PEPF000252DD:EE_|VI0PR08MB10711:EE_
X-MS-Office365-Filtering-Correlation-Id: e2a041f4-f50f-4b28-ad6a-08dd000fe3d0
x-checkrecipientrouted: true
NoDisclaimer: true
X-MS-Exchange-SenderADCheck: 1
X-MS-Exchange-AntiSpam-Relay: 0
X-Microsoft-Antispam-Untrusted: BCL:0;
 ARA:13230040|1800799024|82310400026|36860700013|376014;
X-Microsoft-Antispam-Message-Info-Original: 
 1SQ0iowKWvHwmw1K90LHllVNYNjECna21dEfg5sNmC78f+Uqz5VW0mwOzir/QAs5Nt/3EaQFPt82CQFwgfojbw1L4FDbT1A4uEnOP8b3CLxjX7jWAk6s0ZxAnSXqPayl9ULTheAGAaNL9zSqP1kUCGfOlMpmghkTEjGdvdVdlOJ7+RZE8Y4I4fhbq/S6/m+Phl3sy/YPwd5+TjbJYZQVJoQMI2vZxOGZaG3agsQehj5CJLor9jsEzsd2Fr+TcMEKJXr59yyn5mfIsbayXKLKzRTwLggjIQ13NzZ9s/envXUWYE4dLd+sYZP/ChgERXCZdHVn2014LUL9LKJ7BE1LDRh08TJT73PE+MFJgTgcPXRVTCx3eJxzWMQJyhgTqQqYN1Ch6XMz9ZvtXw8BPLk7BiNocsLcF0TyIZi6wfVm+/daxjxMo5Y9i0Tg5geLFw28Xxvqcl8a01BQ0FsIXWYzMlSSD6xRnFBUoqFg6pnekfpyWSo5xHhKOV73afd3USOqQIH1ENBmUf2XrhJ3u/ZLO7BcVNDES1dbJsXOpS2aXwITfpwiGxRfJZIBzJuvEyH3mF+5asZLnedzZmagkOcsz0X68rDyl904bID61jY5AqNedMiS/owHEzglhRq+5zw7ZfeZQSVwMAgZyOaLkSFCYHKSJ6gCwcxTyrLbrI1FDCk24gxwYelZTXlGa0Fsy/aUQso5diIva3wlPrvHf0J3ppAI7EpRk6YsURqcWf5jKeAFc1VpS7iLHPmDrnJW7dySRYUT64GFaVAibj5bdBfLiO6jSO2gT503O9iz2Ot+lTsRe59fuoAZ0BfgyKFkOFZLrNZriYlii4sWeFOyI3CmDYkyU3vOW7iBlqsDxDcTbytOwV72XEnKYHizPeld5mdFLScXXG1REGe1owe/Ru+dK480GgZqiaA9Tb9j7QwrIqEIjBIqpdfrMrHkH0LoHX0U76OIaiY8jFgCR1KkJSSiWaQtORBYSneJ1BGK9fTzhNFVK9Tti4YaWNPSgge6csluylzn9BCs9rqK6H5CPdFyAF/+RQfGToB+/z4hCvLfhgdJiWXzyMxsBhF3xL9cmAfjQhUcO38G7sJNxSfTWEq4CvjWbmXNZNdB8UFoP+wL2ofzoq+GK+8lMXqbO5+PPUX0U5V0WvGHQ9e3kkBXJIC+kJZX8xyAcbqYzAVa6g5aLmhfTAnyQ/94V9qDkW54YWfe7LE9VksX+tZKS4yymxBR1ch979W6jMncUfmgOls8x5kyi78mcPnA4JvetWDXRFWuCbdb/xakC60l01nqbv5hTkLneOSlDwdmQ6MG3/qL0KSjMTUoMr5lMJguFxS5WtGTCgukAeu6WLHO02sZGiQBygUu5TXNVBH889KZtsIiBNI=
X-Forefront-Antispam-Report-Untrusted: CIP:40.67.248.234; CTRY:IE; LANG:en;
 SCL:1; SRV:; IPV:NLI; SFV:NSPM; H:nebula.arm.com; PTR:InfoDomainNonexistent;
 CAT:NONE; SFS:(13230040)(1800799024)(82310400026)(36860700013)(376014);
 DIR:OUT; SFP:1101;
X-MS-Exchange-Transport-CrossTenantHeadersStamped: DB3PR08MB8843
X-MS-Exchange-SkipListedInternetSender: ip=[2603:10a6:20b:e0::24];
 domain=AM6PR01CA0047.eurprd01.prod.exchangelabs.com
X-MS-Exchange-Transport-CrossTenantHeadersStripped: 
 AM1PEPF000252DD.eurprd07.prod.outlook.com
X-MS-PublicTrafficType: Email
X-MS-Office365-Filtering-Correlation-Id-Prvs: 
 edbb69f3-9fdb-49a9-4fc7-08dd000fdb5a
X-Microsoft-Antispam: BCL:0;
 ARA:13230040|1800799024|376014|35042699022|36860700013|82310400026|14060799003;
X-Microsoft-Antispam-Message-Info: =?utf-8?q?67RKKBGnGQw7f/hPKlAswUsq70LoktE?=
	=?utf-8?q?u6MJLe2UAhf+KTWebzgb0Mo7Qy9d5RkrlF9cdNEbFeyQmgQ3igTJWA9OuX1qhRBP6?=
	=?utf-8?q?DN9gf7FU2MaddhV7GxVMOij7MimdTESnH+XwaTTMV+Da55jxbLrW82V1M4AkKBpKg?=
	=?utf-8?q?9h9N2pKMCZT5CxYntRe1g055iYybxhg1rZQrD2ywriiAEWGjedPHX8h5FFN1ZMhl7?=
	=?utf-8?q?ID1sYtMfMqdoxbtsCERAH6Gw745AsawBPxFnB+55PkWHx01O1U06zyULGA8/KC3wF?=
	=?utf-8?q?pQzmP09/EZpwqQ1X4yth1IqYBu3WiAbR/GhhRYYGg18vwR5TWPLFJpIgZZrYDAlEV?=
	=?utf-8?q?BsmHAdWOAbEVq/fRGmitPHPj5+89SZ2fVQaFiqcsFQfMqKxurSHuJ6kfxa3oTupSy?=
	=?utf-8?q?LF7TC8/TZsPEq4j/E9C/jsTzkxDp+N8z7EhkXwIK4swUd4+4qEI6ior5RK5+3pRSh?=
	=?utf-8?q?tXyBRLXCGuHtTqGUAbkt9llk5UngHCIv1xGdzYZcGmZWDfMYndf3kvwJ8q1FOObzP?=
	=?utf-8?q?tak/Ek1M7l2o/6x+OKYVUrwafWmYGRbvGa6CfSFG7LoO0U/Qzlu/3WF1wAQkREoOQ?=
	=?utf-8?q?1Gqkz6GHud9WfcXfhxV5jRbMMLdqED3/lWZZsVV75BVcMel2+8PfFEKDQfIF7VWn6?=
	=?utf-8?q?1cpCHNIRVjOtv3e7Vs6CNQQqJdw7Pw4H+meEwJA6uTSBBFQuOBwyG+VZHZynSUUQ5?=
	=?utf-8?q?syxhjLfHqmBTX/JMrFIM+/IBkodu35EghWMejfRX0Lsn3WklC17UhYH5I6RL260rV?=
	=?utf-8?q?ll1L9390SmOZCxCzU7EdFomQeAwMSk174IPIWyznRRfeCXl4w7KFOJOPwyENsnwNO?=
	=?utf-8?q?4/shak8ExiSeBHDCpCD9uv2Myyk7z+Myy5sUXX9Rhcd8l9/yD0nDqaZzRtqXcJQSz?=
	=?utf-8?q?jUl4awvpq852BgwTYzG+wtqlUnRV8UZ115sZfUuKnNNi2qsXVkDjGX1h226Px74/u?=
	=?utf-8?q?P30xFZeJg6BVH7pGuBp/ZuJRI/h++LDv+VKObIUinaLlTgTs1MRpuqRBBfUzoScGP?=
	=?utf-8?q?qwQpCzxUtgJC4QOVPM9A15T7Yzo27xQPIJhuw2SSOY/q+AIHBjm7t4qsHczPbgqSB?=
	=?utf-8?q?5LpQ+Pb76qOzcVL8rj6ttH+ZLyMYTfOQjH5kEUUooy1fvHVi9uquZMzk6tgiYj+Y+?=
	=?utf-8?q?7SY7BTVKqj2+aPKJzV4Hch9mwvhpDv1IhkPk1v+6t+5nt3Wcq3ABcleVBlW/4Cnlq?=
	=?utf-8?q?NLqBIw9gq7otFtYUyXooGUyxuXCVp7FPW/cgVmC1RSD8ZScP8/H92RossXYcIQdox?=
	=?utf-8?q?UDowbmoi41LBKTeRSmbdtEP7MwzLD78qxyOnGQK0f+z2osTht6A2RjEY=3D?=
X-Forefront-Antispam-Report: CIP:63.35.35.123; CTRY:IE; LANG:en; SCL:1; SRV:;
 IPV:CAL; SFV:NSPM; H:64aa7808-outbound-1.mta.getcheckrecipient.com;
 PTR:ec2-63-35-35-123.eu-west-1.compute.amazonaws.com; CAT:NONE;
 SFS:(13230040)(1800799024)(376014)(35042699022)(36860700013)(82310400026)(14060799003);
 DIR:OUT; SFP:1101;
X-OriginatorOrg: arm.com
X-MS-Exchange-CrossTenant-OriginalArrivalTime: 08 Nov 2024 16:10:40.2310 (UTC)
X-MS-Exchange-CrossTenant-Network-Message-Id: 
 e2a041f4-f50f-4b28-ad6a-08dd000fe3d0
X-MS-Exchange-CrossTenant-Id: f34e5979-57d9-4aaa-ad4d-b122a662184d
X-MS-Exchange-CrossTenant-OriginalAttributedTenantConnectingIp: 
 TenantId=f34e5979-57d9-4aaa-ad4d-b122a662184d; Ip=[63.35.35.123];
 Helo=[64aa7808-outbound-1.mta.getcheckrecipient.com]
X-MS-Exchange-CrossTenant-AuthSource: 
 AM1PEPF000252DD.eurprd07.prod.outlook.com
X-MS-Exchange-CrossTenant-AuthAs: Anonymous
X-MS-Exchange-CrossTenant-FromEntityHeader: HybridOnPrem
X-MS-Exchange-Transport-CrossTenantHeadersStamped: VI0PR08MB10711
X-BeenThere: gcc-patches@gcc.gnu.org
X-Mailman-Version: 2.1.30
Precedence: list
List-Id: Gcc-patches mailing list <gcc-patches.gcc.gnu.org>
List-Unsubscribe: <https://gcc.gnu.org/mailman/options/gcc-patches>,
 <mailto:gcc-patches-request@gcc.gnu.org?subject=unsubscribe>
List-Archive: <https://gcc.gnu.org/pipermail/gcc-patches/>
List-Post: <mailto:gcc-patches@gcc.gnu.org>
List-Help: <mailto:gcc-patches-request@gcc.gnu.org?subject=help>
List-Subscribe: <https://gcc.gnu.org/mailman/listinfo/gcc-patches>,
 <mailto:gcc-patches-request@gcc.gnu.org?subject=subscribe>
Errors-To: gcc-patches-bounces~incoming=patchwork.ozlabs.org@gcc.gnu.org

This patch adds support for the fp8 related vectors to arm_sve.h. It also
adds support for functions that just treat mfloat8_t as a bag of 8 bits
(reinterpret casts, vector manipulation, loads, stores, element selection,
vector tuples, table lookups, sve<->simd bridge); these functions are
available for fp8 whenever they're available for other 8-bit types.
Arithmetic operations, bit manipulation, conversions are notably absent.

The generated asm is mostly consistent with the _u8 equivalents and this can be
used to validate tests, except where immediates are used. These cannot be
expressed for mf8 and thus we resort to the use of function arguments found in
registers w(0-9).

gcc/
	* config/aarch64/aarch64-sve-builtins.cc (TYPES_all_data): Add mf8.
	(TYPES_reinterpret1, TYPES_reinterpret): Likewise.
	* config/aarch64/aarch64-sve-builtins.def (svmfloat8_t): New type.
	(mf8): New type suffix.
	* config/aarch64/aarch64-sve-builtins.h (TYPE_mfloat): New
	type_class_index.

gcc/testsuite/
	* g++.target/aarch64/sve/acle/general-c++/mangle_1.C: Test mangling
	of svmfloat8_t.
	* g++.target/aarch64/sve/acle/general-c++/mangle_2.C: Likewise for
	__SVMfloat8_t.
	* gcc.target/aarch64/sve/acle/asm/clasta_mf8.c: New test.
	* gcc.target/aarch64/sve/acle/asm/clastb_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/create2_1.c (create2_mf8): Likewise.
	* gcc.target/aarch64/sve/acle/asm/create3_1.c (create_mf8): Likewise.
	* gcc.target/aarch64/sve/acle/asm/create4_1.c (create_mf8): Likewise.
	* gcc.target/aarch64/sve/acle/asm/dup_lane_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/dup_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/dup_neonq_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/dupq_lane_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/ext_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/get_neonq_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/get2_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/get3_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/get4_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/insr_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/lasta_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/lastb_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/ld1_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/ld1ro_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/ld1rq_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/ld2_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/ld3_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/ld4_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/ldff1_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/ldnf1_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/ldnt1_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/len_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/reinterpret_bf16.c
	(reinterpret_bf16_mf8_tied1, reinterpret_bf16_mf8_untied): Likewise.
	* gcc.target/aarch64/sve/acle/asm/reinterpret_f16.c
	(reinterpret_f16_mf8_tied1, reinterpret_f16_mf8_untied): Likewise.
	* gcc.target/aarch64/sve/acle/asm/reinterpret_f32.c
	(reinterpret_f32_mf8_tied1, reinterpret_f32_mf8_untied): Likewise.
	* gcc.target/aarch64/sve/acle/asm/reinterpret_f64.c
	(reinterpret_f64_mf8_tied1, reinterpret_f64_mf8_untied): Likewise.
	* gcc.target/aarch64/sve/acle/asm/reinterpret_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/reinterpret_s16.c
	(reinterpret_s16_mf8_tied1, reinterpret_s16_mf8_untied): Likewise.
	* gcc.target/aarch64/sve/acle/asm/reinterpret_s32.c
	(reinterpret_s32_mf8_tied1, reinterpret_s32_mf8_untied): Likewise.
	* gcc.target/aarch64/sve/acle/asm/reinterpret_s64.c
	(reinterpret_s64_mf8_tied1, reinterpret_s64_mf8_untied): Likewise.
	* gcc.target/aarch64/sve/acle/asm/reinterpret_s8.c
	(reinterpret_s8_mf8_tied1, reinterpret_s8_mf8_untied): Likewise.
	* gcc.target/aarch64/sve/acle/asm/reinterpret_u16.c
	(reinterpret_u16_mf8_tied1, reinterpret_u16_mf8_untied)
	(reinterpret_u16_mf8_x3_untied): Likewise.
	* gcc.target/aarch64/sve/acle/asm/reinterpret_u32.c
	(reinterpret_u32_mf8_tied1, reinterpret_u32_mf8_untied)
	(reinterpret_u32_mf8_x3_untied): Likewise.
	* gcc.target/aarch64/sve/acle/asm/reinterpret_u64.c
	(reinterpret_u64_mf8_tied1, reinterpret_u64_mf8_untied)
	(reinterpret_u64_mf8_x3_untied): Likewise.
	* gcc.target/aarch64/sve/acle/asm/reinterpret_u8.c
	(reinterpret_u8_mf8_tied1, reinterpret_u8_mf8_untied)
	(reinterpret_u8_mf8_x3_untied): Likewise.
	* gcc.target/aarch64/sve/acle/asm/rev_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/sel_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/set_neonq_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/set2_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/set3_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/set4_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/splice_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/st1_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/st2_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/st3_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/st4_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/stnt1_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/tbl_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/trn1_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/trn1q_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/trn2_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/trn2q_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/undef2_1.c (mfloat8_t): Likewise.
	* gcc.target/aarch64/sve/acle/asm/undef3_1.c (mfloat8_t): Likewise.
	* gcc.target/aarch64/sve/acle/asm/undef4_1.c (mfloat8_t): Likewise.
	* gcc.target/aarch64/sve/acle/asm/undef_1.c (mfloat8_t): Likewise.
	* gcc.target/aarch64/sve/acle/asm/uzp1_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/uzp1q_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/uzp2_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/uzp2q_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/zip1_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/zip1q_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/zip2_mf8.c: Likewise.
	* gcc.target/aarch64/sve/acle/asm/zip2q_mf8.c: Likewise.
	* gcc.target/aarch64/sve/pcs/annotate_1.c (ret_mf8, ret_mf8x2)
	(ret_mf8x3, ret_mf8x4): Likewise.
	* gcc.target/aarch64/sve/pcs/annotate_2.c (fn_mf8, fn_mf8x2)
	(fn_mf8x3, fn_mf8x4): Likewise.
	* gcc.target/aarch64/sve/pcs/annotate_3.c (fn_mf8, fn_mf8x2)
	(fn_mf8x3, fn_mf8x4): Likewise.
	* gcc.target/aarch64/sve/pcs/annotate_4.c (fn_mf8, fn_mf8x2)
	(fn_mf8x3, fn_mf8x4): Likewise.
	* gcc.target/aarch64/sve/pcs/annotate_5.c (fn_mf8, fn_mf8x2)
	(fn_mf8x3, fn_mf8x4): Likewise.
	* gcc.target/aarch64/sve/pcs/annotate_6.c (fn_mf8, fn_mf8x2)
	(fn_mf8x3, fn_mf8x4): Likewise.
	* gcc.target/aarch64/sve/pcs/annotate_7.c (fn_mf8, fn_mf8x2)
	(fn_mf8x3, fn_mf8x4): Likewise.
	* gcc.target/aarch64/sve/pcs/args_5_be_mf8.c: Likewise.
	* gcc.target/aarch64/sve/pcs/args_5_le_mf8.c: Likewise.
	* gcc.target/aarch64/sve/pcs/args_6_be_mf8.c: Likewise.
	* gcc.target/aarch64/sve/pcs/args_6_le_mf8.c: Likewise.
	* gcc.target/aarch64/sve/pcs/gnu_vectors_1.c (mfloat8x32_t): New
	typedef.
	(mfloat8_callee, mfloat8_caller): New tests.
	* gcc.target/aarch64/sve/pcs/gnu_vectors_2.c (mfloat8x32_t): New
	typedef.
	(mfloat8_callee, mfloat8_caller): New tests.
	* gcc.target/aarch64/sve/pcs/return_4_128.c
	(CALLER_NON_NUMERIC): Renamed CALLER_BF16 macro.
	(callee_mf8, caller_mf8): New tests.
	* gcc.target/aarch64/sve/pcs/return_4_256.c
	(CALLER_NON_NUMERIC): Renamed CALLER_BF16 macro.
	(callee_mf8, caller_mf8): New tests.
	* gcc.target/aarch64/sve/pcs/return_4_512.c
	(CALLER_NON_NUMERIC): Renamed CALLER_BF16 macro.
	(callee_mf8, caller_mf8): New tests.
	* gcc.target/aarch64/sve/pcs/return_4_1024.c
	(CALLER_NON_NUMERIC): Renamed CALLER_BF16 macro.
	(callee_mf8, caller_mf8): New tests.
	* gcc.target/aarch64/sve/pcs/return_4_2048.c
	(CALLER_NON_NUMERIC): Renamed CALLER_BF16 macro.
	(callee_mf8, caller_mf8): New tests.
	* gcc.target/aarch64/sve/pcs/return_4.c
	(CALLER_NON_NUMERIC): Renamed CALLER_BF16 macro.
	(callee_mf8, caller_mf8): New tests.
	* gcc.target/aarch64/sve/pcs/return_5_128.c
	(CALLER_NON_NUMERIC): Renamed CALLER_BF16 macro.
	(callee_mf8, caller_mf8): New tests.
	* gcc.target/aarch64/sve/pcs/return_5_256.c
	(CALLER_NON_NUMERIC): Renamed CALLER_BF16 macro.
	(callee_mf8, caller_mf8): New tests.
	* gcc.target/aarch64/sve/pcs/return_5_512.c
	(CALLER_NON_NUMERIC): Renamed CALLER_BF16 macro.
	(callee_mf8, caller_mf8): New tests.
	* gcc.target/aarch64/sve/pcs/return_5_1024.c
	(CALLER_NON_NUMERIC): Renamed CALLER_BF16 macro.
	(callee_mf8, caller_mf8): New tests.
	* gcc.target/aarch64/sve/pcs/return_5_2048.c
	(CALLER_NON_NUMERIC): Renamed CALLER_BF16 macro.
	(callee_mf8, caller_mf8): New tests.
	* gcc.target/aarch64/sve/pcs/return_5.c
	(CALLER_NON_NUMERIC): Renamed CALLER_BF16 macro.
	(callee_mf8, caller_mf8): New tests.
	* gcc.target/aarch64/sve/pcs/return_6.c (mfloat8_t): New typedef.
	(callee_mf8, caller_mf8): New tests.
	* gcc.target/aarch64/sve/pcs/return_6_128.c (mfloat8_t): New typedef.
	(callee_mf8, caller_mf8): New tests.
	* gcc.target/aarch64/sve/pcs/return_6_256.c (mfloat8_t): New typedef.
	(callee_mf8, caller_mf8): New tests.
	* gcc.target/aarch64/sve/pcs/return_6_512.c (mfloat8_t): New typedef.
	(callee_mf8, caller_mf8): New tests.
	* gcc.target/aarch64/sve/pcs/return_6_1024.c (mfloat8_t): New typedef.
	(callee_mf8, caller_mf8): New tests.
	* gcc.target/aarch64/sve/pcs/return_6_2048.c (mfloat8_t): New typedef.
	(callee_mf8, caller_mf8): New tests.
	* gcc.target/aarch64/sve/pcs/return_7.c (callee_mf8): New tests.
	(caller_mf8): Likewise.
	* gcc.target/aarch64/sve/pcs/return_8.c (callee_mf8): Likewise
	(caller_mf8): Likewise.
	* gcc.target/aarch64/sve/pcs/return_9.c (callee_mf8): Likewise
	(caller_mf8): Likewise.
	* gcc.target/aarch64/sve/pcs/varargs_2_mf8.c: New tests
	* gcc.target/aarch64/sve2/acle/asm/tbl2_mf8.c: Likewise.
	* gcc.target/aarch64/sve2/acle/asm/tbx_mf8.c: Likewise.
	* gcc.target/aarch64/sve2/acle/asm/whilerw_mf8.c: Likewise.
	* gcc.target/aarch64/sve2/acle/asm/whilewr_mf8.c: Likewise.
---
 gcc/config/aarch64/aarch64-sve-builtins.cc    |   8 +-
 gcc/config/aarch64/aarch64-sve-builtins.def   |   3 +
 gcc/config/aarch64/aarch64-sve-builtins.h     |   1 +
 .../aarch64/sve/acle/general-c++/mangle_1.C   |   2 +
 .../aarch64/sve/acle/general-c++/mangle_2.C   |   2 +
 .../aarch64/sve/acle/asm/clasta_mf8.c         |  52 +++
 .../aarch64/sve/acle/asm/clastb_mf8.c         |  52 +++
 .../aarch64/sve/acle/asm/create2_1.c          |  15 +
 .../aarch64/sve/acle/asm/create3_1.c          |  11 +
 .../aarch64/sve/acle/asm/create4_1.c          |  12 +
 .../aarch64/sve/acle/asm/dup_lane_mf8.c       | 124 ++++++++
 .../gcc.target/aarch64/sve/acle/asm/dup_mf8.c |  31 ++
 .../aarch64/sve/acle/asm/dup_neonq_mf8.c      |  30 ++
 .../aarch64/sve/acle/asm/dupq_lane_mf8.c      |  48 +++
 .../gcc.target/aarch64/sve/acle/asm/ext_mf8.c |  73 +++++
 .../aarch64/sve/acle/asm/get2_mf8.c           |  55 ++++
 .../aarch64/sve/acle/asm/get3_mf8.c           | 108 +++++++
 .../aarch64/sve/acle/asm/get4_mf8.c           | 179 +++++++++++
 .../aarch64/sve/acle/asm/get_neonq_mf8.c      |  33 ++
 .../aarch64/sve/acle/asm/insr_mf8.c           |  22 ++
 .../aarch64/sve/acle/asm/lasta_mf8.c          |  12 +
 .../aarch64/sve/acle/asm/lastb_mf8.c          |  12 +
 .../gcc.target/aarch64/sve/acle/asm/ld1_mf8.c | 162 ++++++++++
 .../aarch64/sve/acle/asm/ld1ro_mf8.c          | 121 +++++++
 .../aarch64/sve/acle/asm/ld1rq_mf8.c          | 137 ++++++++
 .../gcc.target/aarch64/sve/acle/asm/ld2_mf8.c | 204 ++++++++++++
 .../gcc.target/aarch64/sve/acle/asm/ld3_mf8.c | 246 +++++++++++++++
 .../gcc.target/aarch64/sve/acle/asm/ld4_mf8.c | 290 +++++++++++++++++
 .../aarch64/sve/acle/asm/ldff1_mf8.c          |  91 ++++++
 .../aarch64/sve/acle/asm/ldnf1_mf8.c          | 155 +++++++++
 .../aarch64/sve/acle/asm/ldnt1_mf8.c          | 162 ++++++++++
 .../gcc.target/aarch64/sve/acle/asm/len_mf8.c |  12 +
 .../aarch64/sve/acle/asm/reinterpret_bf16.c   |  17 +
 .../aarch64/sve/acle/asm/reinterpret_f16.c    |  17 +
 .../aarch64/sve/acle/asm/reinterpret_f32.c    |  17 +
 .../aarch64/sve/acle/asm/reinterpret_f64.c    |  17 +
 .../aarch64/sve/acle/asm/reinterpret_mf8.c    | 297 ++++++++++++++++++
 .../aarch64/sve/acle/asm/reinterpret_s16.c    |  17 +
 .../aarch64/sve/acle/asm/reinterpret_s32.c    |  17 +
 .../aarch64/sve/acle/asm/reinterpret_s64.c    |  17 +
 .../aarch64/sve/acle/asm/reinterpret_s8.c     |  17 +
 .../aarch64/sve/acle/asm/reinterpret_u16.c    |  28 ++
 .../aarch64/sve/acle/asm/reinterpret_u32.c    |  28 ++
 .../aarch64/sve/acle/asm/reinterpret_u64.c    |  28 ++
 .../aarch64/sve/acle/asm/reinterpret_u8.c     |  28 ++
 .../gcc.target/aarch64/sve/acle/asm/rev_mf8.c |  21 ++
 .../gcc.target/aarch64/sve/acle/asm/sel_mf8.c |  30 ++
 .../aarch64/sve/acle/asm/set2_mf8.c           |  41 +++
 .../aarch64/sve/acle/asm/set3_mf8.c           |  63 ++++
 .../aarch64/sve/acle/asm/set4_mf8.c           |  87 +++++
 .../aarch64/sve/acle/asm/set_neonq_mf8.c      |  23 ++
 .../aarch64/sve/acle/asm/splice_mf8.c         |  33 ++
 .../gcc.target/aarch64/sve/acle/asm/st1_mf8.c | 162 ++++++++++
 .../gcc.target/aarch64/sve/acle/asm/st2_mf8.c | 204 ++++++++++++
 .../gcc.target/aarch64/sve/acle/asm/st3_mf8.c | 246 +++++++++++++++
 .../gcc.target/aarch64/sve/acle/asm/st4_mf8.c | 290 +++++++++++++++++
 .../aarch64/sve/acle/asm/stnt1_mf8.c          | 162 ++++++++++
 .../gcc.target/aarch64/sve/acle/asm/tbl_mf8.c |  30 ++
 .../aarch64/sve/acle/asm/trn1_mf8.c           |  30 ++
 .../aarch64/sve/acle/asm/trn1q_mf8.c          |  33 ++
 .../aarch64/sve/acle/asm/trn2_mf8.c           |  30 ++
 .../aarch64/sve/acle/asm/trn2q_mf8.c          |  33 ++
 .../aarch64/sve/acle/asm/undef2_1.c           |   7 +
 .../aarch64/sve/acle/asm/undef3_1.c           |   7 +
 .../aarch64/sve/acle/asm/undef4_1.c           |   7 +
 .../gcc.target/aarch64/sve/acle/asm/undef_1.c |   7 +
 .../aarch64/sve/acle/asm/uzp1_mf8.c           |  30 ++
 .../aarch64/sve/acle/asm/uzp1q_mf8.c          |  33 ++
 .../aarch64/sve/acle/asm/uzp2_mf8.c           |  30 ++
 .../aarch64/sve/acle/asm/uzp2q_mf8.c          |  33 ++
 .../aarch64/sve/acle/asm/zip1_mf8.c           |  30 ++
 .../aarch64/sve/acle/asm/zip1q_mf8.c          |  33 ++
 .../aarch64/sve/acle/asm/zip2_mf8.c           |  30 ++
 .../aarch64/sve/acle/asm/zip2q_mf8.c          |  33 ++
 .../gcc.target/aarch64/sve/pcs/annotate_1.c   |   8 +
 .../gcc.target/aarch64/sve/pcs/annotate_2.c   |   8 +
 .../gcc.target/aarch64/sve/pcs/annotate_3.c   |   8 +
 .../gcc.target/aarch64/sve/pcs/annotate_4.c   |  12 +
 .../gcc.target/aarch64/sve/pcs/annotate_5.c   |  12 +
 .../gcc.target/aarch64/sve/pcs/annotate_6.c   |  12 +
 .../gcc.target/aarch64/sve/pcs/annotate_7.c   |   8 +
 .../aarch64/sve/pcs/args_5_be_mf8.c           |  63 ++++
 .../aarch64/sve/pcs/args_5_le_mf8.c           |  58 ++++
 .../aarch64/sve/pcs/args_6_be_mf8.c           |  71 +++++
 .../aarch64/sve/pcs/args_6_le_mf8.c           |  70 +++++
 .../aarch64/sve/pcs/gnu_vectors_1.c           |  12 +-
 .../aarch64/sve/pcs/gnu_vectors_2.c           |  10 +-
 .../gcc.target/aarch64/sve/pcs/return_4.c     |  21 +-
 .../aarch64/sve/pcs/return_4_1024.c           |  21 +-
 .../gcc.target/aarch64/sve/pcs/return_4_128.c |  21 +-
 .../aarch64/sve/pcs/return_4_2048.c           |  21 +-
 .../gcc.target/aarch64/sve/pcs/return_4_256.c |  21 +-
 .../gcc.target/aarch64/sve/pcs/return_4_512.c |  21 +-
 .../gcc.target/aarch64/sve/pcs/return_5.c     |  21 +-
 .../aarch64/sve/pcs/return_5_1024.c           |  21 +-
 .../gcc.target/aarch64/sve/pcs/return_5_128.c |  21 +-
 .../aarch64/sve/pcs/return_5_2048.c           |  21 +-
 .../gcc.target/aarch64/sve/pcs/return_5_256.c |  21 +-
 .../gcc.target/aarch64/sve/pcs/return_5_512.c |  21 +-
 .../gcc.target/aarch64/sve/pcs/return_6.c     |  24 ++
 .../aarch64/sve/pcs/return_6_1024.c           |  22 ++
 .../gcc.target/aarch64/sve/pcs/return_6_128.c |  19 ++
 .../aarch64/sve/pcs/return_6_2048.c           |  22 ++
 .../gcc.target/aarch64/sve/pcs/return_6_256.c |  22 ++
 .../gcc.target/aarch64/sve/pcs/return_6_512.c |  22 ++
 .../gcc.target/aarch64/sve/pcs/return_7.c     |  28 ++
 .../gcc.target/aarch64/sve/pcs/return_8.c     |  29 ++
 .../gcc.target/aarch64/sve/pcs/return_9.c     |  33 ++
 .../aarch64/sve/pcs/varargs_2_mf8.c           | 170 ++++++++++
 .../aarch64/sve2/acle/asm/tbl2_mf8.c          |  31 ++
 .../aarch64/sve2/acle/asm/tbx_mf8.c           |  37 +++
 .../aarch64/sve2/acle/asm/whilerw_mf8.c       |  50 +++
 .../aarch64/sve2/acle/asm/whilewr_mf8.c       |  50 +++
 113 files changed, 5941 insertions(+), 30 deletions(-)
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/clasta_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/clastb_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/dup_lane_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/dup_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/dup_neonq_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/dupq_lane_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ext_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/get2_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/get3_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/get4_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/get_neonq_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/insr_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/lasta_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/lastb_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ld1_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ld1ro_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ld1rq_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ld2_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ld3_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ld4_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ldff1_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ldnf1_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ldnt1_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/len_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/rev_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/sel_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/set2_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/set3_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/set4_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/set_neonq_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/splice_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/st1_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/st2_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/st3_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/st4_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/stnt1_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/tbl_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/trn1_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/trn1q_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/trn2_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/trn2q_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/uzp1_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/uzp1q_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/uzp2_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/uzp2q_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/zip1_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/zip1q_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/zip2_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/asm/zip2q_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/pcs/args_5_be_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/pcs/args_5_le_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/pcs/args_6_be_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/pcs/args_6_le_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/pcs/varargs_2_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/tbl2_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/tbx_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/whilerw_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/whilewr_mf8.c

diff --git a/gcc/config/aarch64/aarch64-sve-builtins.cc b/gcc/config/aarch64/aarch64-sve-builtins.cc
index 44b7f6edae5..34384c0f5d7 100644
--- a/gcc/config/aarch64/aarch64-sve-builtins.cc
+++ b/gcc/config/aarch64/aarch64-sve-builtins.cc
@@ -231,12 +231,12 @@ CONSTEXPR const group_suffix_info group_suffixes[] = {
 #define TYPES_all_arith(S, D) \
   TYPES_all_float (S, D), TYPES_all_integer (S, D)
 
-/*     _bf16
+/* _mf8 _bf16
 	_f16 _f32 _f64
    _s8  _s16 _s32 _s64
    _u8  _u16 _u32 _u64.  */
 #define TYPES_all_data(S, D) \
-  S (bf16), TYPES_all_arith (S, D)
+  S(mf8), S (bf16), TYPES_all_arith (S, D)
 
 /* _b only.  */
 #define TYPES_b(S, D) \
@@ -512,16 +512,18 @@ CONSTEXPR const group_suffix_info group_suffixes[] = {
   D (u8, s32), \
   D (u16, s64)
 
-/* {     _bf16           }   {     _bf16           }
+/* { _mf8 _bf16          }   { _mf8 _bf16          }
    {      _f16 _f32 _f64 }   {      _f16 _f32 _f64 }
    { _s8  _s16 _s32 _s64 } x { _s8  _s16 _s32 _s64 }
    { _u8  _u16 _u32 _u64 }   { _u8  _u16 _u32 _u64 }.  */
 #define TYPES_reinterpret1(D, A) \
+  D (A, mf8), \
   D (A, bf16), \
   D (A, f16), D (A, f32), D (A, f64), \
   D (A, s8), D (A, s16), D (A, s32), D (A, s64), \
   D (A, u8), D (A, u16), D (A, u32), D (A, u64)
 #define TYPES_reinterpret(S, D) \
+  TYPES_reinterpret1 (D, mf8), \
   TYPES_reinterpret1 (D, bf16), \
   TYPES_reinterpret1 (D, f16), \
   TYPES_reinterpret1 (D, f32), \
diff --git a/gcc/config/aarch64/aarch64-sve-builtins.def b/gcc/config/aarch64/aarch64-sve-builtins.def
index a9243c40a97..47c396b866d 100644
--- a/gcc/config/aarch64/aarch64-sve-builtins.def
+++ b/gcc/config/aarch64/aarch64-sve-builtins.def
@@ -81,6 +81,7 @@ DEF_SVE_MODE (vnum, none, none, vectors)
 
 DEF_SVE_TYPE (svbool_t, 10, __SVBool_t, boolean_type_node)
 DEF_SVE_TYPE (svcount_t, 11, __SVCount_t, boolean_type_node)
+DEF_SVE_TYPE (svmfloat8_t, 13, __SVMfloat8_t, aarch64_mfp8_type_node)
 DEF_SVE_TYPE (svbfloat16_t, 14, __SVBfloat16_t, bfloat16_type_node)
 DEF_SVE_TYPE (svfloat16_t, 13, __SVFloat16_t, aarch64_fp16_type_node)
 DEF_SVE_TYPE (svfloat32_t, 13, __SVFloat32_t, float_type_node)
@@ -107,6 +108,8 @@ DEF_SVE_TYPE_SUFFIX (c8, svcount_t, count, 8, VNx16BImode)
 DEF_SVE_TYPE_SUFFIX (c16, svcount_t, count, 16, VNx16BImode)
 DEF_SVE_TYPE_SUFFIX (c32, svcount_t, count, 32, VNx16BImode)
 DEF_SVE_TYPE_SUFFIX (c64, svcount_t, count, 64, VNx16BImode)
+DEF_SVE_NEON_TYPE_SUFFIX (mf8, svmfloat8_t, mfloat, 8, VNx16QImode,
+			  Mfloat8x8_t, Mfloat8x16_t)
 DEF_SVE_NEON_TYPE_SUFFIX (bf16, svbfloat16_t, bfloat, 16, VNx8BFmode,
 			  Bfloat16x4_t, Bfloat16x8_t)
 DEF_SVE_NEON_TYPE_SUFFIX (f16, svfloat16_t, float, 16, VNx8HFmode,
diff --git a/gcc/config/aarch64/aarch64-sve-builtins.h b/gcc/config/aarch64/aarch64-sve-builtins.h
index d5cc6e0a40d..28726875401 100644
--- a/gcc/config/aarch64/aarch64-sve-builtins.h
+++ b/gcc/config/aarch64/aarch64-sve-builtins.h
@@ -173,6 +173,7 @@ enum type_class_index
   TYPE_bfloat,
   TYPE_count,
   TYPE_float,
+  TYPE_mfloat,
   TYPE_signed,
   TYPE_unsigned,
   NUM_TYPE_CLASSES
diff --git a/gcc/testsuite/g++.target/aarch64/sve/acle/general-c++/mangle_1.C b/gcc/testsuite/g++.target/aarch64/sve/acle/general-c++/mangle_1.C
index 2ad0c7f9838..c4984065416 100644
--- a/gcc/testsuite/g++.target/aarch64/sve/acle/general-c++/mangle_1.C
+++ b/gcc/testsuite/g++.target/aarch64/sve/acle/general-c++/mangle_1.C
@@ -16,6 +16,7 @@ void f11(svfloat32_t) {}
 void f12(svfloat64_t) {}
 void f13(svbfloat16_t) {}
 void f14(svcount_t) {}
+void f15(svmfloat8_t) {}
 
 /* { dg-final { scan-assembler "_Z2f1u10__SVBool_t:" } } */
 /* { dg-final { scan-assembler "_Z2f2u10__SVInt8_t:" } } */
@@ -31,3 +32,4 @@ void f14(svcount_t) {}
 /* { dg-final { scan-assembler "_Z3f12u13__SVFloat64_t:" } } */
 /* { dg-final { scan-assembler "_Z3f13u14__SVBfloat16_t:" } } */
 /* { dg-final { scan-assembler "_Z3f14u11__SVCount_t:" } } */
+/* { dg-final { scan-assembler "_Z3f15u13__SVMfloat8_t:" } } */
diff --git a/gcc/testsuite/g++.target/aarch64/sve/acle/general-c++/mangle_2.C b/gcc/testsuite/g++.target/aarch64/sve/acle/general-c++/mangle_2.C
index c8bfcc5a9c2..3d83ddb7ab4 100644
--- a/gcc/testsuite/g++.target/aarch64/sve/acle/general-c++/mangle_2.C
+++ b/gcc/testsuite/g++.target/aarch64/sve/acle/general-c++/mangle_2.C
@@ -14,6 +14,7 @@ void f11(__SVFloat32_t) {}
 void f12(__SVFloat64_t) {}
 void f13(__SVBfloat16_t) {}
 void f14(__SVCount_t) {}
+void f15(__SVMfloat8_t) {}
 
 /* { dg-final { scan-assembler "_Z2f1u10__SVBool_t:" } } */
 /* { dg-final { scan-assembler "_Z2f2u10__SVInt8_t:" } } */
@@ -29,3 +30,4 @@ void f14(__SVCount_t) {}
 /* { dg-final { scan-assembler "_Z3f12u13__SVFloat64_t:" } } */
 /* { dg-final { scan-assembler "_Z3f13u14__SVBfloat16_t:" } } */
 /* { dg-final { scan-assembler "_Z3f14u11__SVCount_t:" } } */
+/* { dg-final { scan-assembler "_Z3f15u13__SVMfloat8_t:" } } */
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/clasta_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/clasta_mf8.c
new file mode 100644
index 00000000000..708ecb1ff39
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/clasta_mf8.c
@@ -0,0 +1,52 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** clasta_mf8_tied1:
+**	clasta	z0\.b, p0, z0\.b, z1\.b
+**	ret
+*/
+TEST_UNIFORM_Z (clasta_mf8_tied1, svmfloat8_t,
+		z0 = svclasta_mf8 (p0, z0, z1),
+		z0 = svclasta (p0, z0, z1))
+
+/*
+** clasta_mf8_tied2:
+**	mov	(z[0-9]+)\.d, z0\.d
+**	movprfx	z0, z1
+**	clasta	z0\.b, p0, z0\.b, \1\.b
+**	ret
+*/
+TEST_UNIFORM_Z (clasta_mf8_tied2, svmfloat8_t,
+		z0 = svclasta_mf8 (p0, z1, z0),
+		z0 = svclasta (p0, z1, z0))
+
+/*
+** clasta_mf8_untied:
+**	movprfx	z0, z1
+**	clasta	z0\.b, p0, z0\.b, z2\.b
+**	ret
+*/
+TEST_UNIFORM_Z (clasta_mf8_untied, svmfloat8_t,
+		z0 = svclasta_mf8 (p0, z1, z2),
+		z0 = svclasta (p0, z1, z2))
+
+/*
+** clasta_x0_mf8:
+**	clasta	b0, p0, b0, z2\.b
+**	ret
+*/
+TEST_FOLD_LEFT_X (clasta_x0_mf8, mfloat8_t, svmfloat8_t,
+		  x0 = svclasta_n_mf8 (p0, x0, z0),
+		  x0 = svclasta (p0, x0, z0))
+
+/*
+** clasta_x1_mf8:
+**	clasta	b1, p0, b1, z2\.b
+**	dup	b0, v1.b\[0\]
+**	ret
+*/
+TEST_FOLD_LEFT_X (clasta_x1_mf8, mfloat8_t, svmfloat8_t,
+		  x0 = svclasta_n_mf8 (p0, x1, z0),
+		  x0 = svclasta (p0, x1, z0))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/clastb_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/clastb_mf8.c
new file mode 100644
index 00000000000..179c102caef
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/clastb_mf8.c
@@ -0,0 +1,52 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** clastb_mf8_tied1:
+**	clastb	z0\.b, p0, z0\.b, z1\.b
+**	ret
+*/
+TEST_UNIFORM_Z (clastb_mf8_tied1, svmfloat8_t,
+		z0 = svclastb_mf8 (p0, z0, z1),
+		z0 = svclastb (p0, z0, z1))
+
+/*
+** clastb_mf8_tied2:
+**	mov	(z[0-9]+)\.d, z0\.d
+**	movprfx	z0, z1
+**	clastb	z0\.b, p0, z0\.b, \1\.b
+**	ret
+*/
+TEST_UNIFORM_Z (clastb_mf8_tied2, svmfloat8_t,
+		z0 = svclastb_mf8 (p0, z1, z0),
+		z0 = svclastb (p0, z1, z0))
+
+/*
+** clastb_mf8_untied:
+**	movprfx	z0, z1
+**	clastb	z0\.b, p0, z0\.b, z2\.b
+**	ret
+*/
+TEST_UNIFORM_Z (clastb_mf8_untied, svmfloat8_t,
+		z0 = svclastb_mf8 (p0, z1, z2),
+		z0 = svclastb (p0, z1, z2))
+
+/*
+** clastb_x0_mf8:
+**	clastb	b0, p0, b0, z2\.b
+**	ret
+*/
+TEST_FOLD_LEFT_X (clastb_x0_mf8, mfloat8_t, svmfloat8_t,
+		  x0 = svclastb_n_mf8 (p0, x0, z0),
+		  x0 = svclastb (p0, x0, z0))
+
+/*
+** clastb_x1_mf8:
+**	clastb	b1, p0, b1, z2\.b
+**	dup	b0, v1.b\[0\]
+**	ret
+*/
+TEST_FOLD_LEFT_X (clastb_x1_mf8, mfloat8_t, svmfloat8_t,
+		  x0 = svclastb_n_mf8 (p0, x1, z0),
+		  x0 = svclastb (p0, x1, z0))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/create2_1.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/create2_1.c
index 7e7d8901d21..a9369c8bdf8 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/create2_1.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/create2_1.c
@@ -62,6 +62,21 @@ TEST_CREATE (create2_u16, svuint16x2_t, svuint16_t,
 	     z0 = svcreate2_u16 (z6, z5),
 	     z0 = svcreate2 (z6, z5))
 
+/*
+** create2_mf8:
+** (
+**	mov	z0\.d, z4\.d
+**	mov	z1\.d, z5\.d
+** |
+**	mov	z1\.d, z5\.d
+**	mov	z0\.d, z4\.d
+** )
+**	ret
+*/
+TEST_CREATE (create2_mf8, svmfloat8x2_t, svmfloat8_t,
+	     z0 = svcreate2_mf8 (z4, z5),
+	     z0 = svcreate2 (z4, z5))
+
 /*
 ** create2_bf16:
 ** (
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/create3_1.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/create3_1.c
index 0bea95195b8..da787cb1b3b 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/create3_1.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/create3_1.c
@@ -46,6 +46,17 @@ TEST_CREATE (create3_u16, svuint16x3_t, svuint16_t,
 	     z0 = svcreate3_u16 (z6, z5, z4),
 	     z0 = svcreate3 (z6, z5, z4))
 
+/*
+** create3_mf8:
+**	mov	[^\n]+
+**	mov	[^\n]+
+**	mov	[^\n]+
+**	ret
+*/
+TEST_CREATE (create3_mf8, svmfloat8x3_t, svmfloat8_t,
+	     z0 = svcreate3_mf8 (z4, z5, z6),
+	     z0 = svcreate3 (z4, z5, z6))
+
 /*
 ** create3_bf16:
 **	mov	[^\n]+
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/create4_1.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/create4_1.c
index b5ffd4e6aaf..618a80001d9 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/create4_1.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/create4_1.c
@@ -50,6 +50,18 @@ TEST_CREATE (create4_u16, svuint16x4_t, svuint16_t,
 	     z0 = svcreate4_u16 (z6, z5, z4, z7),
 	     z0 = svcreate4 (z6, z5, z4, z7))
 
+/*
+** create4_mf8:
+**	mov	[^\n]+
+**	mov	[^\n]+
+**	mov	[^\n]+
+**	mov	[^\n]+
+**	ret
+*/
+TEST_CREATE (create4_mf8, svmfloat8x4_t, svmfloat8_t,
+	     z0 = svcreate4_mf8 (z4, z5, z6, z7),
+	     z0 = svcreate4 (z4, z5, z6, z7))
+
 /*
 ** create4_bf16:
 **	mov	[^\n]+
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/dup_lane_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/dup_lane_mf8.c
new file mode 100644
index 00000000000..22bf4185d08
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/dup_lane_mf8.c
@@ -0,0 +1,124 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** dup_lane_w0_mf8_tied1:
+**	mov	(z[0-9]+\.b), w0
+**	tbl	z0\.b, z0\.b, \1
+**	ret
+*/
+TEST_UNIFORM_ZX (dup_lane_w0_mf8_tied1, svmfloat8_t, uint8_t,
+		 z0 = svdup_lane_mf8 (z0, x0),
+		 z0 = svdup_lane (z0, x0))
+
+/*
+** dup_lane_w0_mf8_untied:
+**	mov	(z[0-9]+\.b), w0
+**	tbl	z0\.b, z1\.b, \1
+**	ret
+*/
+TEST_UNIFORM_ZX (dup_lane_w0_mf8_untied, svmfloat8_t, uint8_t,
+		 z0 = svdup_lane_mf8 (z1, x0),
+		 z0 = svdup_lane (z1, x0))
+
+/*
+** dup_lane_0_mf8_tied1:
+**	dup	z0\.b, z0\.b\[0\]
+**	ret
+*/
+TEST_UNIFORM_Z (dup_lane_0_mf8_tied1, svmfloat8_t,
+		z0 = svdup_lane_mf8 (z0, 0),
+		z0 = svdup_lane (z0, 0))
+
+/*
+** dup_lane_0_mf8_untied:
+**	dup	z0\.b, z1\.b\[0\]
+**	ret
+*/
+TEST_UNIFORM_Z (dup_lane_0_mf8_untied, svmfloat8_t,
+		z0 = svdup_lane_mf8 (z1, 0),
+		z0 = svdup_lane (z1, 0))
+
+/*
+** dup_lane_7_mf8:
+**	dup	z0\.b, z0\.b\[7\]
+**	ret
+*/
+TEST_UNIFORM_Z (dup_lane_7_mf8, svmfloat8_t,
+		z0 = svdup_lane_mf8 (z0, 7),
+		z0 = svdup_lane (z0, 7))
+
+/*
+** dup_lane_8_mf8:
+**	dup	z0\.b, z0\.b\[8\]
+**	ret
+*/
+TEST_UNIFORM_Z (dup_lane_8_mf8, svmfloat8_t,
+		z0 = svdup_lane_mf8 (z0, 8),
+		z0 = svdup_lane (z0, 8))
+
+/*
+** dup_lane_15_mf8:
+**	dup	z0\.b, z0\.b\[15\]
+**	ret
+*/
+TEST_UNIFORM_Z (dup_lane_15_mf8, svmfloat8_t,
+		z0 = svdup_lane_mf8 (z0, 15),
+		z0 = svdup_lane (z0, 15))
+
+/*
+** dup_lane_16_mf8:
+**	dup	z0\.b, z0\.b\[16\]
+**	ret
+*/
+TEST_UNIFORM_Z (dup_lane_16_mf8, svmfloat8_t,
+		z0 = svdup_lane_mf8 (z0, 16),
+		z0 = svdup_lane (z0, 16))
+
+/*
+** dup_lane_31_mf8:
+**	dup	z0\.b, z0\.b\[31\]
+**	ret
+*/
+TEST_UNIFORM_Z (dup_lane_31_mf8, svmfloat8_t,
+		z0 = svdup_lane_mf8 (z0, 31),
+		z0 = svdup_lane (z0, 31))
+
+/*
+** dup_lane_32_mf8:
+**	dup	z0\.b, z0\.b\[32\]
+**	ret
+*/
+TEST_UNIFORM_Z (dup_lane_32_mf8, svmfloat8_t,
+		z0 = svdup_lane_mf8 (z0, 32),
+		z0 = svdup_lane (z0, 32))
+
+/*
+** dup_lane_63_mf8:
+**	dup	z0\.b, z0\.b\[63\]
+**	ret
+*/
+TEST_UNIFORM_Z (dup_lane_63_mf8, svmfloat8_t,
+		z0 = svdup_lane_mf8 (z0, 63),
+		z0 = svdup_lane (z0, 63))
+
+/*
+** dup_lane_64_mf8:
+**	mov	(z[0-9]+\.b), #64
+**	tbl	z0\.b, z0\.b, \1
+**	ret
+*/
+TEST_UNIFORM_Z (dup_lane_64_mf8, svmfloat8_t,
+		z0 = svdup_lane_mf8 (z0, 64),
+		z0 = svdup_lane (z0, 64))
+
+/*
+** dup_lane_255_mf8:
+**	mov	(z[0-9]+\.b), #-1
+**	tbl	z0\.b, z0\.b, \1
+**	ret
+*/
+TEST_UNIFORM_Z (dup_lane_255_mf8, svmfloat8_t,
+		z0 = svdup_lane_mf8 (z0, 255),
+		z0 = svdup_lane (z0, 255))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/dup_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/dup_mf8.c
new file mode 100644
index 00000000000..fbeac4b46ae
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/dup_mf8.c
@@ -0,0 +1,31 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** dup_w0_mf8:
+**	mov	z0\.b, b4
+**	ret
+*/
+TEST_UNIFORM_ZX (dup_w0_mf8, svmfloat8_t, mfloat8_t,
+		 z0 = svdup_n_mf8 (x0),
+		 z0 = svdup_mf8 (x0))
+
+/*
+** dup_w0_mf8_m:
+**	movprfx	z0, z1
+**	mov	z0\.b, p0/m, b4
+**	ret
+*/
+TEST_UNIFORM_ZX (dup_w0_mf8_m, svmfloat8_t, mfloat8_t,
+		z0 = svdup_n_mf8_m (z1, p0, x0),
+		z0 = svdup_mf8_m (z1, p0, x0))
+
+/*
+** dup_w0_mf8_x:
+**	mov	z0\.b, b4
+**	ret
+*/
+TEST_UNIFORM_ZX (dup_w0_mf8_x, svmfloat8_t, mfloat8_t,
+		z0 = svdup_n_mf8_x (p0, x0),
+		z0 = svdup_mf8_x (p0, x0))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/dup_neonq_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/dup_neonq_mf8.c
new file mode 100644
index 00000000000..55cf2742bac
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/dup_neonq_mf8.c
@@ -0,0 +1,30 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** dup_neonq_mf8_z0:
+**	dup	z0.q, z4.q\[0\]
+**	ret
+*/
+TEST_DUP_NEONQ (dup_neonq_mf8_z0, mfloat8x16_t, svmfloat8_t,
+	  z0 = svdup_neonq_mf8 (z4),
+	  z0 = svdup_neonq (z4))
+
+/*
+** dup_neonq_mf8_z4:
+**	dup	z4.q, z4.q\[0\]
+**	ret
+*/
+TEST_DUP_NEONQ (dup_neonq_mf8_z4, mfloat8x16_t, svmfloat8_t,
+	  z4_res = svdup_neonq_mf8 (z4),
+	  z4_res = svdup_neonq (z4))
+
+/*
+** dup_neonq_mf8_z5:
+**	dup	z5.q, z4.q\[0\]
+**	ret
+*/
+TEST_DUP_NEONQ (dup_neonq_mf8_z5, mfloat8x16_t, svmfloat8_t,
+	  z5_res = svdup_neonq_mf8 (z4),
+	  z5_res = svdup_neonq (z4))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/dupq_lane_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/dupq_lane_mf8.c
new file mode 100644
index 00000000000..02e95f73c19
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/dupq_lane_mf8.c
@@ -0,0 +1,48 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** dupq_lane_0_mf8_tied:
+**	dup	z0\.q, z0\.q\[0\]
+**	ret
+*/
+TEST_UNIFORM_Z (dupq_lane_0_mf8_tied, svmfloat8_t,
+		z0 = svdupq_lane_mf8 (z0, 0),
+		z0 = svdupq_lane (z0, 0))
+
+/*
+** dupq_lane_0_mf8_untied:
+**	dup	z0\.q, z1\.q\[0\]
+**	ret
+*/
+TEST_UNIFORM_Z (dupq_lane_0_mf8_untied, svmfloat8_t,
+		z0 = svdupq_lane_mf8 (z1, 0),
+		z0 = svdupq_lane (z1, 0))
+
+/*
+** dupq_lane_1_mf8:
+**	dup	z0\.q, z0\.q\[1\]
+**	ret
+*/
+TEST_UNIFORM_Z (dupq_lane_1_mf8, svmfloat8_t,
+		z0 = svdupq_lane_mf8 (z0, 1),
+		z0 = svdupq_lane (z0, 1))
+
+/*
+** dupq_lane_2_mf8:
+**	dup	z0\.q, z0\.q\[2\]
+**	ret
+*/
+TEST_UNIFORM_Z (dupq_lane_2_mf8, svmfloat8_t,
+		z0 = svdupq_lane_mf8 (z0, 2),
+		z0 = svdupq_lane (z0, 2))
+
+/*
+** dupq_lane_3_mf8:
+**	dup	z0\.q, z0\.q\[3\]
+**	ret
+*/
+TEST_UNIFORM_Z (dupq_lane_3_mf8, svmfloat8_t,
+		z0 = svdupq_lane_mf8 (z0, 3),
+		z0 = svdupq_lane (z0, 3))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ext_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ext_mf8.c
new file mode 100644
index 00000000000..ceeca3dd367
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ext_mf8.c
@@ -0,0 +1,73 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** ext_0_mf8_tied1:
+**	ext	z0\.b, z0\.b, z1\.b, #0
+**	ret
+*/
+TEST_UNIFORM_Z (ext_0_mf8_tied1, svmfloat8_t,
+		z0 = svext_mf8 (z0, z1, 0),
+		z0 = svext (z0, z1, 0))
+
+/*
+** ext_0_mf8_tied2:
+**	mov	(z[0-9]+)\.d, z0\.d
+**	movprfx	z0, z1
+**	ext	z0\.b, z0\.b, \1\.b, #0
+**	ret
+*/
+TEST_UNIFORM_Z (ext_0_mf8_tied2, svmfloat8_t,
+		z0 = svext_mf8 (z1, z0, 0),
+		z0 = svext (z1, z0, 0))
+
+/*
+** ext_0_mf8_untied:
+**	movprfx	z0, z1
+**	ext	z0\.b, z0\.b, z2\.b, #0
+**	ret
+*/
+TEST_UNIFORM_Z (ext_0_mf8_untied, svmfloat8_t,
+		z0 = svext_mf8 (z1, z2, 0),
+		z0 = svext (z1, z2, 0))
+
+/*
+** ext_1_mf8:
+**	movprfx	z0, z1
+**	ext	z0\.b, z0\.b, z2\.b, #1
+**	ret
+*/
+TEST_UNIFORM_Z (ext_1_mf8, svmfloat8_t,
+		z0 = svext_mf8 (z1, z2, 1),
+		z0 = svext (z1, z2, 1))
+
+/*
+** ext_2_mf8:
+**	movprfx	z0, z1
+**	ext	z0\.b, z0\.b, z2\.b, #2
+**	ret
+*/
+TEST_UNIFORM_Z (ext_2_mf8, svmfloat8_t,
+		z0 = svext_mf8 (z1, z2, 2),
+		z0 = svext (z1, z2, 2))
+
+/*
+** ext_3_mf8:
+**	movprfx	z0, z1
+**	ext	z0\.b, z0\.b, z2\.b, #3
+**	ret
+*/
+TEST_UNIFORM_Z (ext_3_mf8, svmfloat8_t,
+		z0 = svext_mf8 (z1, z2, 3),
+		z0 = svext (z1, z2, 3))
+
+/*
+** ext_255_mf8:
+**	movprfx	z0, z1
+**	ext	z0\.b, z0\.b, z2\.b, #255
+**	ret
+*/
+TEST_UNIFORM_Z (ext_255_mf8, svmfloat8_t,
+		z0 = svext_mf8 (z1, z2, 255),
+		z0 = svext (z1, z2, 255))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/get2_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/get2_mf8.c
new file mode 100644
index 00000000000..e365f09d17e
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/get2_mf8.c
@@ -0,0 +1,55 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** get2_mf8_z0_0:
+**	mov	z0\.d, z4\.d
+**	ret
+*/
+TEST_GET (get2_mf8_z0_0, svmfloat8x2_t, svmfloat8_t,
+	  z0 = svget2_mf8 (z4, 0),
+	  z0 = svget2 (z4, 0))
+
+/*
+** get2_mf8_z0_1:
+**	mov	z0\.d, z5\.d
+**	ret
+*/
+TEST_GET (get2_mf8_z0_1, svmfloat8x2_t, svmfloat8_t,
+	  z0 = svget2_mf8 (z4, 1),
+	  z0 = svget2 (z4, 1))
+
+/*
+** get2_mf8_z4_0:
+**	ret
+*/
+TEST_GET (get2_mf8_z4_0, svmfloat8x2_t, svmfloat8_t,
+	  z4_res = svget2_mf8 (z4, 0),
+	  z4_res = svget2 (z4, 0))
+
+/*
+** get2_mf8_z4_1:
+**	mov	z4\.d, z5\.d
+**	ret
+*/
+TEST_GET (get2_mf8_z4_1, svmfloat8x2_t, svmfloat8_t,
+	  z4_res = svget2_mf8 (z4, 1),
+	  z4_res = svget2 (z4, 1))
+
+/*
+** get2_mf8_z5_0:
+**	mov	z5\.d, z4\.d
+**	ret
+*/
+TEST_GET (get2_mf8_z5_0, svmfloat8x2_t, svmfloat8_t,
+	  z5_res = svget2_mf8 (z4, 0),
+	  z5_res = svget2 (z4, 0))
+
+/*
+** get2_mf8_z5_1:
+**	ret
+*/
+TEST_GET (get2_mf8_z5_1, svmfloat8x2_t, svmfloat8_t,
+	  z5_res = svget2_mf8 (z4, 1),
+	  z5_res = svget2 (z4, 1))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/get3_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/get3_mf8.c
new file mode 100644
index 00000000000..6acab814c59
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/get3_mf8.c
@@ -0,0 +1,108 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** get3_mf8_z0_0:
+**	mov	z0\.d, z4\.d
+**	ret
+*/
+TEST_GET (get3_mf8_z0_0, svmfloat8x3_t, svmfloat8_t,
+	  z0 = svget3_mf8 (z4, 0),
+	  z0 = svget3 (z4, 0))
+
+/*
+** get3_mf8_z0_1:
+**	mov	z0\.d, z5\.d
+**	ret
+*/
+TEST_GET (get3_mf8_z0_1, svmfloat8x3_t, svmfloat8_t,
+	  z0 = svget3_mf8 (z4, 1),
+	  z0 = svget3 (z4, 1))
+
+/*
+** get3_mf8_z0_2:
+**	mov	z0\.d, z6\.d
+**	ret
+*/
+TEST_GET (get3_mf8_z0_2, svmfloat8x3_t, svmfloat8_t,
+	  z0 = svget3_mf8 (z4, 2),
+	  z0 = svget3 (z4, 2))
+
+/*
+** get3_mf8_z4_0:
+**	ret
+*/
+TEST_GET (get3_mf8_z4_0, svmfloat8x3_t, svmfloat8_t,
+	  z4_res = svget3_mf8 (z4, 0),
+	  z4_res = svget3 (z4, 0))
+
+/*
+** get3_mf8_z4_1:
+**	mov	z4\.d, z5\.d
+**	ret
+*/
+TEST_GET (get3_mf8_z4_1, svmfloat8x3_t, svmfloat8_t,
+	  z4_res = svget3_mf8 (z4, 1),
+	  z4_res = svget3 (z4, 1))
+
+/*
+** get3_mf8_z4_2:
+**	mov	z4\.d, z6\.d
+**	ret
+*/
+TEST_GET (get3_mf8_z4_2, svmfloat8x3_t, svmfloat8_t,
+	  z4_res = svget3_mf8 (z4, 2),
+	  z4_res = svget3 (z4, 2))
+
+/*
+** get3_mf8_z5_0:
+**	mov	z5\.d, z4\.d
+**	ret
+*/
+TEST_GET (get3_mf8_z5_0, svmfloat8x3_t, svmfloat8_t,
+	  z5_res = svget3_mf8 (z4, 0),
+	  z5_res = svget3 (z4, 0))
+
+/*
+** get3_mf8_z5_1:
+**	ret
+*/
+TEST_GET (get3_mf8_z5_1, svmfloat8x3_t, svmfloat8_t,
+	  z5_res = svget3_mf8 (z4, 1),
+	  z5_res = svget3 (z4, 1))
+
+/*
+** get3_mf8_z5_2:
+**	mov	z5\.d, z6\.d
+**	ret
+*/
+TEST_GET (get3_mf8_z5_2, svmfloat8x3_t, svmfloat8_t,
+	  z5_res = svget3_mf8 (z4, 2),
+	  z5_res = svget3 (z4, 2))
+
+/*
+** get3_mf8_z6_0:
+**	mov	z6\.d, z4\.d
+**	ret
+*/
+TEST_GET (get3_mf8_z6_0, svmfloat8x3_t, svmfloat8_t,
+	  z6_res = svget3_mf8 (z4, 0),
+	  z6_res = svget3 (z4, 0))
+
+/*
+** get3_mf8_z6_1:
+**	mov	z6\.d, z5\.d
+**	ret
+*/
+TEST_GET (get3_mf8_z6_1, svmfloat8x3_t, svmfloat8_t,
+	  z6_res = svget3_mf8 (z4, 1),
+	  z6_res = svget3 (z4, 1))
+
+/*
+** get3_mf8_z6_2:
+**	ret
+*/
+TEST_GET (get3_mf8_z6_2, svmfloat8x3_t, svmfloat8_t,
+	  z6_res = svget3_mf8 (z4, 2),
+	  z6_res = svget3 (z4, 2))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/get4_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/get4_mf8.c
new file mode 100644
index 00000000000..cdee90adb4a
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/get4_mf8.c
@@ -0,0 +1,179 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** get4_mf8_z0_0:
+**	mov	z0\.d, z4\.d
+**	ret
+*/
+TEST_GET (get4_mf8_z0_0, svmfloat8x4_t, svmfloat8_t,
+	  z0 = svget4_mf8 (z4, 0),
+	  z0 = svget4 (z4, 0))
+
+/*
+** get4_mf8_z0_1:
+**	mov	z0\.d, z5\.d
+**	ret
+*/
+TEST_GET (get4_mf8_z0_1, svmfloat8x4_t, svmfloat8_t,
+	  z0 = svget4_mf8 (z4, 1),
+	  z0 = svget4 (z4, 1))
+
+/*
+** get4_mf8_z0_2:
+**	mov	z0\.d, z6\.d
+**	ret
+*/
+TEST_GET (get4_mf8_z0_2, svmfloat8x4_t, svmfloat8_t,
+	  z0 = svget4_mf8 (z4, 2),
+	  z0 = svget4 (z4, 2))
+
+/*
+** get4_mf8_z0_3:
+**	mov	z0\.d, z7\.d
+**	ret
+*/
+TEST_GET (get4_mf8_z0_3, svmfloat8x4_t, svmfloat8_t,
+	  z0 = svget4_mf8 (z4, 3),
+	  z0 = svget4 (z4, 3))
+
+/*
+** get4_mf8_z4_0:
+**	ret
+*/
+TEST_GET (get4_mf8_z4_0, svmfloat8x4_t, svmfloat8_t,
+	  z4_res = svget4_mf8 (z4, 0),
+	  z4_res = svget4 (z4, 0))
+
+/*
+** get4_mf8_z4_1:
+**	mov	z4\.d, z5\.d
+**	ret
+*/
+TEST_GET (get4_mf8_z4_1, svmfloat8x4_t, svmfloat8_t,
+	  z4_res = svget4_mf8 (z4, 1),
+	  z4_res = svget4 (z4, 1))
+
+/*
+** get4_mf8_z4_2:
+**	mov	z4\.d, z6\.d
+**	ret
+*/
+TEST_GET (get4_mf8_z4_2, svmfloat8x4_t, svmfloat8_t,
+	  z4_res = svget4_mf8 (z4, 2),
+	  z4_res = svget4 (z4, 2))
+
+/*
+** get4_mf8_z4_3:
+**	mov	z4\.d, z7\.d
+**	ret
+*/
+TEST_GET (get4_mf8_z4_3, svmfloat8x4_t, svmfloat8_t,
+	  z4_res = svget4_mf8 (z4, 3),
+	  z4_res = svget4 (z4, 3))
+
+/*
+** get4_mf8_z5_0:
+**	mov	z5\.d, z4\.d
+**	ret
+*/
+TEST_GET (get4_mf8_z5_0, svmfloat8x4_t, svmfloat8_t,
+	  z5_res = svget4_mf8 (z4, 0),
+	  z5_res = svget4 (z4, 0))
+
+/*
+** get4_mf8_z5_1:
+**	ret
+*/
+TEST_GET (get4_mf8_z5_1, svmfloat8x4_t, svmfloat8_t,
+	  z5_res = svget4_mf8 (z4, 1),
+	  z5_res = svget4 (z4, 1))
+
+/*
+** get4_mf8_z5_2:
+**	mov	z5\.d, z6\.d
+**	ret
+*/
+TEST_GET (get4_mf8_z5_2, svmfloat8x4_t, svmfloat8_t,
+	  z5_res = svget4_mf8 (z4, 2),
+	  z5_res = svget4 (z4, 2))
+
+/*
+** get4_mf8_z5_3:
+**	mov	z5\.d, z7\.d
+**	ret
+*/
+TEST_GET (get4_mf8_z5_3, svmfloat8x4_t, svmfloat8_t,
+	  z5_res = svget4_mf8 (z4, 3),
+	  z5_res = svget4 (z4, 3))
+
+/*
+** get4_mf8_z6_0:
+**	mov	z6\.d, z4\.d
+**	ret
+*/
+TEST_GET (get4_mf8_z6_0, svmfloat8x4_t, svmfloat8_t,
+	  z6_res = svget4_mf8 (z4, 0),
+	  z6_res = svget4 (z4, 0))
+
+/*
+** get4_mf8_z6_1:
+**	mov	z6\.d, z5\.d
+**	ret
+*/
+TEST_GET (get4_mf8_z6_1, svmfloat8x4_t, svmfloat8_t,
+	  z6_res = svget4_mf8 (z4, 1),
+	  z6_res = svget4 (z4, 1))
+
+/*
+** get4_mf8_z6_2:
+**	ret
+*/
+TEST_GET (get4_mf8_z6_2, svmfloat8x4_t, svmfloat8_t,
+	  z6_res = svget4_mf8 (z4, 2),
+	  z6_res = svget4 (z4, 2))
+
+/*
+** get4_mf8_z6_3:
+**	mov	z6\.d, z7\.d
+**	ret
+*/
+TEST_GET (get4_mf8_z6_3, svmfloat8x4_t, svmfloat8_t,
+	  z6_res = svget4_mf8 (z4, 3),
+	  z6_res = svget4 (z4, 3))
+
+/*
+** get4_mf8_z7_0:
+**	mov	z7\.d, z4\.d
+**	ret
+*/
+TEST_GET (get4_mf8_z7_0, svmfloat8x4_t, svmfloat8_t,
+	  z7_res = svget4_mf8 (z4, 0),
+	  z7_res = svget4 (z4, 0))
+
+/*
+** get4_mf8_z7_1:
+**	mov	z7\.d, z5\.d
+**	ret
+*/
+TEST_GET (get4_mf8_z7_1, svmfloat8x4_t, svmfloat8_t,
+	  z7_res = svget4_mf8 (z4, 1),
+	  z7_res = svget4 (z4, 1))
+
+/*
+** get4_mf8_z7_2:
+**	mov	z7\.d, z6\.d
+**	ret
+*/
+TEST_GET (get4_mf8_z7_2, svmfloat8x4_t, svmfloat8_t,
+	  z7_res = svget4_mf8 (z4, 2),
+	  z7_res = svget4 (z4, 2))
+
+/*
+** get4_mf8_z7_3:
+**	ret
+*/
+TEST_GET (get4_mf8_z7_3, svmfloat8x4_t, svmfloat8_t,
+	  z7_res = svget4_mf8 (z4, 3),
+	  z7_res = svget4 (z4, 3))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/get_neonq_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/get_neonq_mf8.c
new file mode 100644
index 00000000000..d659a821fa1
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/get_neonq_mf8.c
@@ -0,0 +1,33 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** get_neonq_mf8_z0:
+**	mov	v0.16b, v4.16b
+**	ret
+*/
+TEST_GET (get_neonq_mf8_z0, svmfloat8_t, mfloat8x16_t,
+	  z0 = svget_neonq_mf8 (z4),
+	  z0 = svget_neonq (z4))
+
+/*
+** get_neonq_mf8_z4:
+**	ret
+*/
+TEST_GET (get_neonq_mf8_z4, svmfloat8_t, mfloat8x16_t,
+	  z4_res = svget_neonq_mf8 (z4),
+	  z4_res = svget_neonq (z4))
+
+/*
+** get_neonq_mf8_z5:
+**	(
+**	mov	z5.d, z4.d
+**	|
+**	mov	v5.16b, v4.16b
+**	)
+**	ret
+*/
+TEST_GET (get_neonq_mf8_z5, svmfloat8_t, mfloat8x16_t,
+	  z5_res = svget_neonq_mf8 (z4),
+	  z5_res = svget_neonq (z4))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/insr_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/insr_mf8.c
new file mode 100644
index 00000000000..69dfc0a97c8
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/insr_mf8.c
@@ -0,0 +1,22 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** insr_w0_mf8_tied1:
+**	insr	z0\.b, b4
+**	ret
+*/
+TEST_UNIFORM_ZX (insr_w0_mf8_tied1, svmfloat8_t, mfloat8_t,
+		 z0 = svinsr_n_mf8 (z0, x0),
+		 z0 = svinsr (z0, x0))
+
+/*
+** insr_w0_mf8_untied:
+**	movprfx	z0, z1
+**	insr	z0\.b, b4
+**	ret
+*/
+TEST_UNIFORM_ZX (insr_w0_mf8_untied, svmfloat8_t, mfloat8_t,
+		 z0 = svinsr_n_mf8 (z1, x0),
+		 z0 = svinsr (z1, x0))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/lasta_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/lasta_mf8.c
new file mode 100644
index 00000000000..8e8cb51e65e
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/lasta_mf8.c
@@ -0,0 +1,12 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** lasta_x0_mf8:
+**	lasta	b0, p0, z0\.b
+**	ret
+*/
+TEST_REDUCTION_X (lasta_x0_mf8, mfloat8_t, svmfloat8_t,
+		  x0 = svlasta_mf8 (p0, z0),
+		  x0 = svlasta (p0, z0))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/lastb_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/lastb_mf8.c
new file mode 100644
index 00000000000..a0d96f83f55
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/lastb_mf8.c
@@ -0,0 +1,12 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** lastb_x0_mf8:
+**	lastb	b0, p0, z0\.b
+**	ret
+*/
+TEST_REDUCTION_X (lastb_x0_mf8, mfloat8_t, svmfloat8_t,
+		  x0 = svlastb_mf8 (p0, z0),
+		  x0 = svlastb (p0, z0))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ld1_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ld1_mf8.c
new file mode 100644
index 00000000000..7fdc60faeec
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ld1_mf8.c
@@ -0,0 +1,162 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" { target { ! ilp32 } } } } */
+
+#include "test_sve_acle.h"
+
+/*
+** ld1_mf8_base:
+**	ld1b	z0\.b, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld1_mf8_base, svmfloat8_t, mfloat8_t,
+	   z0 = svld1_mf8 (p0, x0),
+	   z0 = svld1 (p0, x0))
+
+/*
+** ld1_mf8_index:
+**	ld1b	z0\.b, p0/z, \[x0, x1\]
+**	ret
+*/
+TEST_LOAD (ld1_mf8_index, svmfloat8_t, mfloat8_t,
+	   z0 = svld1_mf8 (p0, x0 + x1),
+	   z0 = svld1 (p0, x0 + x1))
+
+/*
+** ld1_mf8_1:
+**	ld1b	z0\.b, p0/z, \[x0, #1, mul vl\]
+**	ret
+*/
+TEST_LOAD (ld1_mf8_1, svmfloat8_t, mfloat8_t,
+	   z0 = svld1_mf8 (p0, x0 + svcntb ()),
+	   z0 = svld1 (p0, x0 + svcntb ()))
+
+/*
+** ld1_mf8_7:
+**	ld1b	z0\.b, p0/z, \[x0, #7, mul vl\]
+**	ret
+*/
+TEST_LOAD (ld1_mf8_7, svmfloat8_t, mfloat8_t,
+	   z0 = svld1_mf8 (p0, x0 + svcntb () * 7),
+	   z0 = svld1 (p0, x0 + svcntb () * 7))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** ld1_mf8_8:
+**	incb	x0, all, mul #8
+**	ld1b	z0\.b, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld1_mf8_8, svmfloat8_t, mfloat8_t,
+	   z0 = svld1_mf8 (p0, x0 + svcntb () * 8),
+	   z0 = svld1 (p0, x0 + svcntb () * 8))
+
+/*
+** ld1_mf8_m1:
+**	ld1b	z0\.b, p0/z, \[x0, #-1, mul vl\]
+**	ret
+*/
+TEST_LOAD (ld1_mf8_m1, svmfloat8_t, mfloat8_t,
+	   z0 = svld1_mf8 (p0, x0 - svcntb ()),
+	   z0 = svld1 (p0, x0 - svcntb ()))
+
+/*
+** ld1_mf8_m8:
+**	ld1b	z0\.b, p0/z, \[x0, #-8, mul vl\]
+**	ret
+*/
+TEST_LOAD (ld1_mf8_m8, svmfloat8_t, mfloat8_t,
+	   z0 = svld1_mf8 (p0, x0 - svcntb () * 8),
+	   z0 = svld1 (p0, x0 - svcntb () * 8))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** ld1_mf8_m9:
+**	decb	x0, all, mul #9
+**	ld1b	z0\.b, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld1_mf8_m9, svmfloat8_t, mfloat8_t,
+	   z0 = svld1_mf8 (p0, x0 - svcntb () * 9),
+	   z0 = svld1 (p0, x0 - svcntb () * 9))
+
+/*
+** ld1_vnum_mf8_0:
+**	ld1b	z0\.b, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld1_vnum_mf8_0, svmfloat8_t, mfloat8_t,
+	   z0 = svld1_vnum_mf8 (p0, x0, 0),
+	   z0 = svld1_vnum (p0, x0, 0))
+
+/*
+** ld1_vnum_mf8_1:
+**	ld1b	z0\.b, p0/z, \[x0, #1, mul vl\]
+**	ret
+*/
+TEST_LOAD (ld1_vnum_mf8_1, svmfloat8_t, mfloat8_t,
+	   z0 = svld1_vnum_mf8 (p0, x0, 1),
+	   z0 = svld1_vnum (p0, x0, 1))
+
+/*
+** ld1_vnum_mf8_7:
+**	ld1b	z0\.b, p0/z, \[x0, #7, mul vl\]
+**	ret
+*/
+TEST_LOAD (ld1_vnum_mf8_7, svmfloat8_t, mfloat8_t,
+	   z0 = svld1_vnum_mf8 (p0, x0, 7),
+	   z0 = svld1_vnum (p0, x0, 7))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** ld1_vnum_mf8_8:
+**	incb	x0, all, mul #8
+**	ld1b	z0\.b, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld1_vnum_mf8_8, svmfloat8_t, mfloat8_t,
+	   z0 = svld1_vnum_mf8 (p0, x0, 8),
+	   z0 = svld1_vnum (p0, x0, 8))
+
+/*
+** ld1_vnum_mf8_m1:
+**	ld1b	z0\.b, p0/z, \[x0, #-1, mul vl\]
+**	ret
+*/
+TEST_LOAD (ld1_vnum_mf8_m1, svmfloat8_t, mfloat8_t,
+	   z0 = svld1_vnum_mf8 (p0, x0, -1),
+	   z0 = svld1_vnum (p0, x0, -1))
+
+/*
+** ld1_vnum_mf8_m8:
+**	ld1b	z0\.b, p0/z, \[x0, #-8, mul vl\]
+**	ret
+*/
+TEST_LOAD (ld1_vnum_mf8_m8, svmfloat8_t, mfloat8_t,
+	   z0 = svld1_vnum_mf8 (p0, x0, -8),
+	   z0 = svld1_vnum (p0, x0, -8))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** ld1_vnum_mf8_m9:
+**	decb	x0, all, mul #9
+**	ld1b	z0\.b, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld1_vnum_mf8_m9, svmfloat8_t, mfloat8_t,
+	   z0 = svld1_vnum_mf8 (p0, x0, -9),
+	   z0 = svld1_vnum (p0, x0, -9))
+
+/*
+** ld1_vnum_mf8_x1:
+**	cntb	(x[0-9]+)
+** (
+**	madd	(x[0-9]+), (?:x1, \1|\1, x1), x0
+**	ld1b	z0\.b, p0/z, \[\2\]
+** |
+**	mul	(x[0-9]+), (?:x1, \1|\1, x1)
+**	ld1b	z0\.b, p0/z, \[x0, \3\]
+** )
+**	ret
+*/
+TEST_LOAD (ld1_vnum_mf8_x1, svmfloat8_t, mfloat8_t,
+	   z0 = svld1_vnum_mf8 (p0, x0, x1),
+	   z0 = svld1_vnum (p0, x0, x1))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ld1ro_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ld1ro_mf8.c
new file mode 100644
index 00000000000..08b7f68f7d7
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ld1ro_mf8.c
@@ -0,0 +1,121 @@
+/* { dg-skip-if "" { *-*-* } { "-DSTREAMING_COMPATIBLE" } { "" } } */
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" { target { ! ilp32 } } } } */
+/* { dg-additional-options "-march=armv8.6-a+f64mm" } */
+/* { dg-require-effective-target aarch64_asm_f64mm_ok }  */
+
+#include "test_sve_acle.h"
+
+/*
+** ld1ro_mf8_base:
+**	ld1rob	z0\.b, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld1ro_mf8_base, svmfloat8_t, mfloat8_t,
+	   z0 = svld1ro_mf8 (p0, x0),
+	   z0 = svld1ro (p0, x0))
+
+/*
+** ld1ro_mf8_index:
+**	ld1rob	z0\.b, p0/z, \[x0, x1\]
+**	ret
+*/
+TEST_LOAD (ld1ro_mf8_index, svmfloat8_t, mfloat8_t,
+	   z0 = svld1ro_mf8 (p0, x0 + x1),
+	   z0 = svld1ro (p0, x0 + x1))
+
+/*
+** ld1ro_mf8_1:
+**	add	(x[0-9]+), x0, #?1
+**	ld1rob	z0\.b, p0/z, \[\1\]
+**	ret
+*/
+TEST_LOAD (ld1ro_mf8_1, svmfloat8_t, mfloat8_t,
+	   z0 = svld1ro_mf8 (p0, x0 + 1),
+	   z0 = svld1ro (p0, x0 + 1))
+
+/*
+** ld1ro_mf8_16:
+**	add	(x[0-9]+), x0, #?16
+**	ld1rob	z0\.b, p0/z, \[\1\]
+**	ret
+*/
+TEST_LOAD (ld1ro_mf8_16, svmfloat8_t, mfloat8_t,
+	   z0 = svld1ro_mf8 (p0, x0 + 16),
+	   z0 = svld1ro (p0, x0 + 16))
+
+/*
+** ld1ro_mf8_256:
+**	add	(x[0-9]+), x0, #?256
+**	ld1rob	z0\.b, p0/z, \[\1\]
+**	ret
+*/
+TEST_LOAD (ld1ro_mf8_256, svmfloat8_t, mfloat8_t,
+	   z0 = svld1ro_mf8 (p0, x0 + 256),
+	   z0 = svld1ro (p0, x0 + 256))
+
+/*
+** ld1ro_mf8_m1:
+**	sub	(x[0-9]+), x0, #?1
+**	ld1rob	z0\.b, p0/z, \[\1\]
+**	ret
+*/
+TEST_LOAD (ld1ro_mf8_m1, svmfloat8_t, mfloat8_t,
+	   z0 = svld1ro_mf8 (p0, x0 - 1),
+	   z0 = svld1ro (p0, x0 - 1))
+
+/*
+** ld1ro_mf8_m16:
+**	sub	(x[0-9]+), x0, #?16
+**	ld1rob	z0\.b, p0/z, \[\1\]
+**	ret
+*/
+TEST_LOAD (ld1ro_mf8_m16, svmfloat8_t, mfloat8_t,
+	   z0 = svld1ro_mf8 (p0, x0 - 16),
+	   z0 = svld1ro (p0, x0 - 16))
+
+/*
+** ld1ro_mf8_m288:
+**	sub	(x[0-9]+), x0, #?288
+**	ld1rob	z0\.b, p0/z, \[\1\]
+**	ret
+*/
+TEST_LOAD (ld1ro_mf8_m288, svmfloat8_t, mfloat8_t,
+	   z0 = svld1ro_mf8 (p0, x0 - 288),
+	   z0 = svld1ro (p0, x0 - 288))
+
+/*
+** ld1ro_mf8_32:
+**	ld1rob	z0\.b, p0/z, \[x0, #?32\]
+**	ret
+*/
+TEST_LOAD (ld1ro_mf8_32, svmfloat8_t, mfloat8_t,
+	   z0 = svld1ro_mf8 (p0, x0 + 32),
+	   z0 = svld1ro (p0, x0 + 32))
+
+/*
+** ld1ro_mf8_224:
+**	ld1rob	z0\.b, p0/z, \[x0, #?224\]
+**	ret
+*/
+TEST_LOAD (ld1ro_mf8_224, svmfloat8_t, mfloat8_t,
+	   z0 = svld1ro_mf8 (p0, x0 + 224),
+	   z0 = svld1ro (p0, x0 + 224))
+
+/*
+** ld1ro_mf8_m32:
+**	ld1rob	z0\.b, p0/z, \[x0, #?-32\]
+**	ret
+*/
+TEST_LOAD (ld1ro_mf8_m32, svmfloat8_t, mfloat8_t,
+	   z0 = svld1ro_mf8 (p0, x0 - 32),
+	   z0 = svld1ro (p0, x0 - 32))
+
+/*
+** ld1ro_mf8_m256:
+**	ld1rob	z0\.b, p0/z, \[x0, #?-256\]
+**	ret
+*/
+TEST_LOAD (ld1ro_mf8_m256, svmfloat8_t, mfloat8_t,
+	   z0 = svld1ro_mf8 (p0, x0 - 256),
+	   z0 = svld1ro (p0, x0 - 256))
+
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ld1rq_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ld1rq_mf8.c
new file mode 100644
index 00000000000..b3a3f4f09bc
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ld1rq_mf8.c
@@ -0,0 +1,137 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" { target { ! ilp32 } } } } */
+
+#include "test_sve_acle.h"
+
+/*
+** ld1rq_mf8_base:
+**	ld1rqb	z0\.b, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld1rq_mf8_base, svmfloat8_t, mfloat8_t,
+	   z0 = svld1rq_mf8 (p0, x0),
+	   z0 = svld1rq (p0, x0))
+
+/*
+** ld1rq_mf8_index:
+**	ld1rqb	z0\.b, p0/z, \[x0, x1\]
+**	ret
+*/
+TEST_LOAD (ld1rq_mf8_index, svmfloat8_t, mfloat8_t,
+	   z0 = svld1rq_mf8 (p0, x0 + x1),
+	   z0 = svld1rq (p0, x0 + x1))
+
+/*
+** ld1rq_mf8_1:
+**	add	(x[0-9]+), x0, #?1
+**	ld1rqb	z0\.b, p0/z, \[\1\]
+**	ret
+*/
+TEST_LOAD (ld1rq_mf8_1, svmfloat8_t, mfloat8_t,
+	   z0 = svld1rq_mf8 (p0, x0 + 1),
+	   z0 = svld1rq (p0, x0 + 1))
+
+/*
+** ld1rq_mf8_8:
+**	add	(x[0-9]+), x0, #?8
+**	ld1rqb	z0\.b, p0/z, \[\1\]
+**	ret
+*/
+TEST_LOAD (ld1rq_mf8_8, svmfloat8_t, mfloat8_t,
+	   z0 = svld1rq_mf8 (p0, x0 + 8),
+	   z0 = svld1rq (p0, x0 + 8))
+
+/*
+** ld1rq_mf8_15:
+**	add	(x[0-9]+), x0, #?15
+**	ld1rqb	z0\.b, p0/z, \[\1\]
+**	ret
+*/
+TEST_LOAD (ld1rq_mf8_15, svmfloat8_t, mfloat8_t,
+	   z0 = svld1rq_mf8 (p0, x0 + 15),
+	   z0 = svld1rq (p0, x0 + 15))
+
+/*
+** ld1rq_mf8_16:
+**	ld1rqb	z0\.b, p0/z, \[x0, #?16\]
+**	ret
+*/
+TEST_LOAD (ld1rq_mf8_16, svmfloat8_t, mfloat8_t,
+	   z0 = svld1rq_mf8 (p0, x0 + 16),
+	   z0 = svld1rq (p0, x0 + 16))
+
+/*
+** ld1rq_mf8_112:
+**	ld1rqb	z0\.b, p0/z, \[x0, #?112\]
+**	ret
+*/
+TEST_LOAD (ld1rq_mf8_112, svmfloat8_t, mfloat8_t,
+	   z0 = svld1rq_mf8 (p0, x0 + 112),
+	   z0 = svld1rq (p0, x0 + 112))
+
+/*
+** ld1rq_mf8_128:
+**	add	(x[0-9]+), x0, #?128
+**	ld1rqb	z0\.b, p0/z, \[\1\]
+**	ret
+*/
+TEST_LOAD (ld1rq_mf8_128, svmfloat8_t, mfloat8_t,
+	   z0 = svld1rq_mf8 (p0, x0 + 128),
+	   z0 = svld1rq (p0, x0 + 128))
+
+/*
+** ld1rq_mf8_m1:
+**	sub	(x[0-9]+), x0, #?1
+**	ld1rqb	z0\.b, p0/z, \[\1\]
+**	ret
+*/
+TEST_LOAD (ld1rq_mf8_m1, svmfloat8_t, mfloat8_t,
+	   z0 = svld1rq_mf8 (p0, x0 - 1),
+	   z0 = svld1rq (p0, x0 - 1))
+
+/*
+** ld1rq_mf8_m8:
+**	sub	(x[0-9]+), x0, #?8
+**	ld1rqb	z0\.b, p0/z, \[\1\]
+**	ret
+*/
+TEST_LOAD (ld1rq_mf8_m8, svmfloat8_t, mfloat8_t,
+	   z0 = svld1rq_mf8 (p0, x0 - 8),
+	   z0 = svld1rq (p0, x0 - 8))
+
+/*
+** ld1rq_mf8_m15:
+**	sub	(x[0-9]+), x0, #?15
+**	ld1rqb	z0\.b, p0/z, \[\1\]
+**	ret
+*/
+TEST_LOAD (ld1rq_mf8_m15, svmfloat8_t, mfloat8_t,
+	   z0 = svld1rq_mf8 (p0, x0 - 15),
+	   z0 = svld1rq (p0, x0 - 15))
+
+/*
+** ld1rq_mf8_m16:
+**	ld1rqb	z0\.b, p0/z, \[x0, #?-16\]
+**	ret
+*/
+TEST_LOAD (ld1rq_mf8_m16, svmfloat8_t, mfloat8_t,
+	   z0 = svld1rq_mf8 (p0, x0 - 16),
+	   z0 = svld1rq (p0, x0 - 16))
+
+/*
+** ld1rq_mf8_m128:
+**	ld1rqb	z0\.b, p0/z, \[x0, #?-128\]
+**	ret
+*/
+TEST_LOAD (ld1rq_mf8_m128, svmfloat8_t, mfloat8_t,
+	   z0 = svld1rq_mf8 (p0, x0 - 128),
+	   z0 = svld1rq (p0, x0 - 128))
+
+/*
+** ld1rq_mf8_m144:
+**	sub	(x[0-9]+), x0, #?144
+**	ld1rqb	z0\.b, p0/z, \[\1\]
+**	ret
+*/
+TEST_LOAD (ld1rq_mf8_m144, svmfloat8_t, mfloat8_t,
+	   z0 = svld1rq_mf8 (p0, x0 - 144),
+	   z0 = svld1rq (p0, x0 - 144))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ld2_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ld2_mf8.c
new file mode 100644
index 00000000000..b533bf8169b
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ld2_mf8.c
@@ -0,0 +1,204 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" { target { ! ilp32 } } } } */
+
+#include "test_sve_acle.h"
+
+/*
+** ld2_mf8_base:
+**	ld2b	{z0\.b(?: - |, )z1\.b}, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld2_mf8_base, svmfloat8x2_t, mfloat8_t,
+	   z0 = svld2_mf8 (p0, x0),
+	   z0 = svld2 (p0, x0))
+
+/*
+** ld2_mf8_index:
+**	ld2b	{z0\.b(?: - |, )z1\.b}, p0/z, \[x0, x1\]
+**	ret
+*/
+TEST_LOAD (ld2_mf8_index, svmfloat8x2_t, mfloat8_t,
+	   z0 = svld2_mf8 (p0, x0 + x1),
+	   z0 = svld2 (p0, x0 + x1))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** ld2_mf8_1:
+**	incb	x0
+**	ld2b	{z0\.b(?: - |, )z1\.b}, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld2_mf8_1, svmfloat8x2_t, mfloat8_t,
+	   z0 = svld2_mf8 (p0, x0 + svcntb ()),
+	   z0 = svld2 (p0, x0 + svcntb ()))
+
+/*
+** ld2_mf8_2:
+**	ld2b	{z0\.b(?: - |, )z1\.b}, p0/z, \[x0, #2, mul vl\]
+**	ret
+*/
+TEST_LOAD (ld2_mf8_2, svmfloat8x2_t, mfloat8_t,
+	   z0 = svld2_mf8 (p0, x0 + svcntb () * 2),
+	   z0 = svld2 (p0, x0 + svcntb () * 2))
+
+/*
+** ld2_mf8_14:
+**	ld2b	{z0\.b(?: - |, )z1\.b}, p0/z, \[x0, #14, mul vl\]
+**	ret
+*/
+TEST_LOAD (ld2_mf8_14, svmfloat8x2_t, mfloat8_t,
+	   z0 = svld2_mf8 (p0, x0 + svcntb () * 14),
+	   z0 = svld2 (p0, x0 + svcntb () * 14))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** ld2_mf8_16:
+**	incb	x0, all, mul #16
+**	ld2b	{z0\.b(?: - |, )z1\.b}, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld2_mf8_16, svmfloat8x2_t, mfloat8_t,
+	   z0 = svld2_mf8 (p0, x0 + svcntb () * 16),
+	   z0 = svld2 (p0, x0 + svcntb () * 16))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** ld2_mf8_m1:
+**	decb	x0
+**	ld2b	{z0\.b(?: - |, )z1\.b}, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld2_mf8_m1, svmfloat8x2_t, mfloat8_t,
+	   z0 = svld2_mf8 (p0, x0 - svcntb ()),
+	   z0 = svld2 (p0, x0 - svcntb ()))
+
+/*
+** ld2_mf8_m2:
+**	ld2b	{z0\.b(?: - |, )z1\.b}, p0/z, \[x0, #-2, mul vl\]
+**	ret
+*/
+TEST_LOAD (ld2_mf8_m2, svmfloat8x2_t, mfloat8_t,
+	   z0 = svld2_mf8 (p0, x0 - svcntb () * 2),
+	   z0 = svld2 (p0, x0 - svcntb () * 2))
+
+/*
+** ld2_mf8_m16:
+**	ld2b	{z0\.b(?: - |, )z1\.b}, p0/z, \[x0, #-16, mul vl\]
+**	ret
+*/
+TEST_LOAD (ld2_mf8_m16, svmfloat8x2_t, mfloat8_t,
+	   z0 = svld2_mf8 (p0, x0 - svcntb () * 16),
+	   z0 = svld2 (p0, x0 - svcntb () * 16))
+
+/*
+** ld2_mf8_m18:
+**	addvl	(x[0-9]+), x0, #-18
+**	ld2b	{z0\.b(?: - |, )z1\.b}, p0/z, \[\1\]
+**	ret
+*/
+TEST_LOAD (ld2_mf8_m18, svmfloat8x2_t, mfloat8_t,
+	   z0 = svld2_mf8 (p0, x0 - svcntb () * 18),
+	   z0 = svld2 (p0, x0 - svcntb () * 18))
+
+/*
+** ld2_vnum_mf8_0:
+**	ld2b	{z0\.b(?: - |, )z1\.b}, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld2_vnum_mf8_0, svmfloat8x2_t, mfloat8_t,
+	   z0 = svld2_vnum_mf8 (p0, x0, 0),
+	   z0 = svld2_vnum (p0, x0, 0))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** ld2_vnum_mf8_1:
+**	incb	x0
+**	ld2b	{z0\.b(?: - |, )z1\.b}, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld2_vnum_mf8_1, svmfloat8x2_t, mfloat8_t,
+	   z0 = svld2_vnum_mf8 (p0, x0, 1),
+	   z0 = svld2_vnum (p0, x0, 1))
+
+/*
+** ld2_vnum_mf8_2:
+**	ld2b	{z0\.b(?: - |, )z1\.b}, p0/z, \[x0, #2, mul vl\]
+**	ret
+*/
+TEST_LOAD (ld2_vnum_mf8_2, svmfloat8x2_t, mfloat8_t,
+	   z0 = svld2_vnum_mf8 (p0, x0, 2),
+	   z0 = svld2_vnum (p0, x0, 2))
+
+/*
+** ld2_vnum_mf8_14:
+**	ld2b	{z0\.b(?: - |, )z1\.b}, p0/z, \[x0, #14, mul vl\]
+**	ret
+*/
+TEST_LOAD (ld2_vnum_mf8_14, svmfloat8x2_t, mfloat8_t,
+	   z0 = svld2_vnum_mf8 (p0, x0, 14),
+	   z0 = svld2_vnum (p0, x0, 14))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** ld2_vnum_mf8_16:
+**	incb	x0, all, mul #16
+**	ld2b	{z0\.b(?: - |, )z1\.b}, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld2_vnum_mf8_16, svmfloat8x2_t, mfloat8_t,
+	   z0 = svld2_vnum_mf8 (p0, x0, 16),
+	   z0 = svld2_vnum (p0, x0, 16))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** ld2_vnum_mf8_m1:
+**	decb	x0
+**	ld2b	{z0\.b(?: - |, )z1\.b}, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld2_vnum_mf8_m1, svmfloat8x2_t, mfloat8_t,
+	   z0 = svld2_vnum_mf8 (p0, x0, -1),
+	   z0 = svld2_vnum (p0, x0, -1))
+
+/*
+** ld2_vnum_mf8_m2:
+**	ld2b	{z0\.b(?: - |, )z1\.b}, p0/z, \[x0, #-2, mul vl\]
+**	ret
+*/
+TEST_LOAD (ld2_vnum_mf8_m2, svmfloat8x2_t, mfloat8_t,
+	   z0 = svld2_vnum_mf8 (p0, x0, -2),
+	   z0 = svld2_vnum (p0, x0, -2))
+
+/*
+** ld2_vnum_mf8_m16:
+**	ld2b	{z0\.b(?: - |, )z1\.b}, p0/z, \[x0, #-16, mul vl\]
+**	ret
+*/
+TEST_LOAD (ld2_vnum_mf8_m16, svmfloat8x2_t, mfloat8_t,
+	   z0 = svld2_vnum_mf8 (p0, x0, -16),
+	   z0 = svld2_vnum (p0, x0, -16))
+
+/*
+** ld2_vnum_mf8_m18:
+**	addvl	(x[0-9]+), x0, #-18
+**	ld2b	{z0\.b(?: - |, )z1\.b}, p0/z, \[\1\]
+**	ret
+*/
+TEST_LOAD (ld2_vnum_mf8_m18, svmfloat8x2_t, mfloat8_t,
+	   z0 = svld2_vnum_mf8 (p0, x0, -18),
+	   z0 = svld2_vnum (p0, x0, -18))
+
+/*
+** ld2_vnum_mf8_x1:
+**	cntb	(x[0-9]+)
+** (
+**	madd	(x[0-9]+), (?:x1, \1|\1, x1), x0
+**	ld2b	{z0\.b(?: - |, )z1\.b}, p0/z, \[\2\]
+** |
+**	mul	(x[0-9]+), (?:x1, \1|\1, x1)
+**	ld2b	{z0\.b(?: - |, )z1\.b}, p0/z, \[x0, \3\]
+** )
+**	ret
+*/
+TEST_LOAD (ld2_vnum_mf8_x1, svmfloat8x2_t, mfloat8_t,
+	   z0 = svld2_vnum_mf8 (p0, x0, x1),
+	   z0 = svld2_vnum (p0, x0, x1))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ld3_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ld3_mf8.c
new file mode 100644
index 00000000000..f43d8050e7d
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ld3_mf8.c
@@ -0,0 +1,246 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" { target { ! ilp32 } } } } */
+
+#include "test_sve_acle.h"
+
+/*
+** ld3_mf8_base:
+**	ld3b	{z0\.b - z2\.b}, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld3_mf8_base, svmfloat8x3_t, mfloat8_t,
+	   z0 = svld3_mf8 (p0, x0),
+	   z0 = svld3 (p0, x0))
+
+/*
+** ld3_mf8_index:
+**	ld3b	{z0\.b - z2\.b}, p0/z, \[x0, x1\]
+**	ret
+*/
+TEST_LOAD (ld3_mf8_index, svmfloat8x3_t, mfloat8_t,
+	   z0 = svld3_mf8 (p0, x0 + x1),
+	   z0 = svld3 (p0, x0 + x1))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** ld3_mf8_1:
+**	incb	x0
+**	ld3b	{z0\.b - z2\.b}, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld3_mf8_1, svmfloat8x3_t, mfloat8_t,
+	   z0 = svld3_mf8 (p0, x0 + svcntb ()),
+	   z0 = svld3 (p0, x0 + svcntb ()))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** ld3_mf8_2:
+**	incb	x0, all, mul #2
+**	ld3b	{z0\.b - z2\.b}, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld3_mf8_2, svmfloat8x3_t, mfloat8_t,
+	   z0 = svld3_mf8 (p0, x0 + svcntb () * 2),
+	   z0 = svld3 (p0, x0 + svcntb () * 2))
+
+/*
+** ld3_mf8_3:
+**	ld3b	{z0\.b - z2\.b}, p0/z, \[x0, #3, mul vl\]
+**	ret
+*/
+TEST_LOAD (ld3_mf8_3, svmfloat8x3_t, mfloat8_t,
+	   z0 = svld3_mf8 (p0, x0 + svcntb () * 3),
+	   z0 = svld3 (p0, x0 + svcntb () * 3))
+
+/*
+** ld3_mf8_21:
+**	ld3b	{z0\.b - z2\.b}, p0/z, \[x0, #21, mul vl\]
+**	ret
+*/
+TEST_LOAD (ld3_mf8_21, svmfloat8x3_t, mfloat8_t,
+	   z0 = svld3_mf8 (p0, x0 + svcntb () * 21),
+	   z0 = svld3 (p0, x0 + svcntb () * 21))
+
+/*
+** ld3_mf8_24:
+**	addvl	(x[0-9]+), x0, #24
+**	ld3b	{z0\.b - z2\.b}, p0/z, \[\1\]
+**	ret
+*/
+TEST_LOAD (ld3_mf8_24, svmfloat8x3_t, mfloat8_t,
+	   z0 = svld3_mf8 (p0, x0 + svcntb () * 24),
+	   z0 = svld3 (p0, x0 + svcntb () * 24))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** ld3_mf8_m1:
+**	decb	x0
+**	ld3b	{z0\.b - z2\.b}, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld3_mf8_m1, svmfloat8x3_t, mfloat8_t,
+	   z0 = svld3_mf8 (p0, x0 - svcntb ()),
+	   z0 = svld3 (p0, x0 - svcntb ()))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** ld3_mf8_m2:
+**	decb	x0, all, mul #2
+**	ld3b	{z0\.b - z2\.b}, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld3_mf8_m2, svmfloat8x3_t, mfloat8_t,
+	   z0 = svld3_mf8 (p0, x0 - svcntb () * 2),
+	   z0 = svld3 (p0, x0 - svcntb () * 2))
+
+/*
+** ld3_mf8_m3:
+**	ld3b	{z0\.b - z2\.b}, p0/z, \[x0, #-3, mul vl\]
+**	ret
+*/
+TEST_LOAD (ld3_mf8_m3, svmfloat8x3_t, mfloat8_t,
+	   z0 = svld3_mf8 (p0, x0 - svcntb () * 3),
+	   z0 = svld3 (p0, x0 - svcntb () * 3))
+
+/*
+** ld3_mf8_m24:
+**	ld3b	{z0\.b - z2\.b}, p0/z, \[x0, #-24, mul vl\]
+**	ret
+*/
+TEST_LOAD (ld3_mf8_m24, svmfloat8x3_t, mfloat8_t,
+	   z0 = svld3_mf8 (p0, x0 - svcntb () * 24),
+	   z0 = svld3 (p0, x0 - svcntb () * 24))
+
+/*
+** ld3_mf8_m27:
+**	addvl	(x[0-9]+), x0, #-27
+**	ld3b	{z0\.b - z2\.b}, p0/z, \[\1\]
+**	ret
+*/
+TEST_LOAD (ld3_mf8_m27, svmfloat8x3_t, mfloat8_t,
+	   z0 = svld3_mf8 (p0, x0 - svcntb () * 27),
+	   z0 = svld3 (p0, x0 - svcntb () * 27))
+
+/*
+** ld3_vnum_mf8_0:
+**	ld3b	{z0\.b - z2\.b}, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld3_vnum_mf8_0, svmfloat8x3_t, mfloat8_t,
+	   z0 = svld3_vnum_mf8 (p0, x0, 0),
+	   z0 = svld3_vnum (p0, x0, 0))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** ld3_vnum_mf8_1:
+**	incb	x0
+**	ld3b	{z0\.b - z2\.b}, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld3_vnum_mf8_1, svmfloat8x3_t, mfloat8_t,
+	   z0 = svld3_vnum_mf8 (p0, x0, 1),
+	   z0 = svld3_vnum (p0, x0, 1))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** ld3_vnum_mf8_2:
+**	incb	x0, all, mul #2
+**	ld3b	{z0\.b - z2\.b}, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld3_vnum_mf8_2, svmfloat8x3_t, mfloat8_t,
+	   z0 = svld3_vnum_mf8 (p0, x0, 2),
+	   z0 = svld3_vnum (p0, x0, 2))
+
+/*
+** ld3_vnum_mf8_3:
+**	ld3b	{z0\.b - z2\.b}, p0/z, \[x0, #3, mul vl\]
+**	ret
+*/
+TEST_LOAD (ld3_vnum_mf8_3, svmfloat8x3_t, mfloat8_t,
+	   z0 = svld3_vnum_mf8 (p0, x0, 3),
+	   z0 = svld3_vnum (p0, x0, 3))
+
+/*
+** ld3_vnum_mf8_21:
+**	ld3b	{z0\.b - z2\.b}, p0/z, \[x0, #21, mul vl\]
+**	ret
+*/
+TEST_LOAD (ld3_vnum_mf8_21, svmfloat8x3_t, mfloat8_t,
+	   z0 = svld3_vnum_mf8 (p0, x0, 21),
+	   z0 = svld3_vnum (p0, x0, 21))
+
+/*
+** ld3_vnum_mf8_24:
+**	addvl	(x[0-9]+), x0, #24
+**	ld3b	{z0\.b - z2\.b}, p0/z, \[\1\]
+**	ret
+*/
+TEST_LOAD (ld3_vnum_mf8_24, svmfloat8x3_t, mfloat8_t,
+	   z0 = svld3_vnum_mf8 (p0, x0, 24),
+	   z0 = svld3_vnum (p0, x0, 24))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** ld3_vnum_mf8_m1:
+**	decb	x0
+**	ld3b	{z0\.b - z2\.b}, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld3_vnum_mf8_m1, svmfloat8x3_t, mfloat8_t,
+	   z0 = svld3_vnum_mf8 (p0, x0, -1),
+	   z0 = svld3_vnum (p0, x0, -1))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** ld3_vnum_mf8_m2:
+**	decb	x0, all, mul #2
+**	ld3b	{z0\.b - z2\.b}, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld3_vnum_mf8_m2, svmfloat8x3_t, mfloat8_t,
+	   z0 = svld3_vnum_mf8 (p0, x0, -2),
+	   z0 = svld3_vnum (p0, x0, -2))
+
+/*
+** ld3_vnum_mf8_m3:
+**	ld3b	{z0\.b - z2\.b}, p0/z, \[x0, #-3, mul vl\]
+**	ret
+*/
+TEST_LOAD (ld3_vnum_mf8_m3, svmfloat8x3_t, mfloat8_t,
+	   z0 = svld3_vnum_mf8 (p0, x0, -3),
+	   z0 = svld3_vnum (p0, x0, -3))
+
+/*
+** ld3_vnum_mf8_m24:
+**	ld3b	{z0\.b - z2\.b}, p0/z, \[x0, #-24, mul vl\]
+**	ret
+*/
+TEST_LOAD (ld3_vnum_mf8_m24, svmfloat8x3_t, mfloat8_t,
+	   z0 = svld3_vnum_mf8 (p0, x0, -24),
+	   z0 = svld3_vnum (p0, x0, -24))
+
+/*
+** ld3_vnum_mf8_m27:
+**	addvl	(x[0-9]+), x0, #-27
+**	ld3b	{z0\.b - z2\.b}, p0/z, \[\1\]
+**	ret
+*/
+TEST_LOAD (ld3_vnum_mf8_m27, svmfloat8x3_t, mfloat8_t,
+	   z0 = svld3_vnum_mf8 (p0, x0, -27),
+	   z0 = svld3_vnum (p0, x0, -27))
+
+/*
+** ld3_vnum_mf8_x1:
+**	cntb	(x[0-9]+)
+** (
+**	madd	(x[0-9]+), (?:x1, \1|\1, x1), x0
+**	ld3b	{z0\.b - z2\.b}, p0/z, \[\2\]
+** |
+**	mul	(x[0-9]+), (?:x1, \1|\1, x1)
+**	ld3b	{z0\.b - z2\.b}, p0/z, \[x0, \3\]
+** )
+**	ret
+*/
+TEST_LOAD (ld3_vnum_mf8_x1, svmfloat8x3_t, mfloat8_t,
+	   z0 = svld3_vnum_mf8 (p0, x0, x1),
+	   z0 = svld3_vnum (p0, x0, x1))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ld4_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ld4_mf8.c
new file mode 100644
index 00000000000..e4e9dc016c6
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ld4_mf8.c
@@ -0,0 +1,290 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" { target { ! ilp32 } } } } */
+
+#include "test_sve_acle.h"
+
+/*
+** ld4_mf8_base:
+**	ld4b	{z0\.b - z3\.b}, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld4_mf8_base, svmfloat8x4_t, mfloat8_t,
+	   z0 = svld4_mf8 (p0, x0),
+	   z0 = svld4 (p0, x0))
+
+/*
+** ld4_mf8_index:
+**	ld4b	{z0\.b - z3\.b}, p0/z, \[x0, x1\]
+**	ret
+*/
+TEST_LOAD (ld4_mf8_index, svmfloat8x4_t, mfloat8_t,
+	   z0 = svld4_mf8 (p0, x0 + x1),
+	   z0 = svld4 (p0, x0 + x1))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** ld4_mf8_1:
+**	incb	x0
+**	ld4b	{z0\.b - z3\.b}, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld4_mf8_1, svmfloat8x4_t, mfloat8_t,
+	   z0 = svld4_mf8 (p0, x0 + svcntb ()),
+	   z0 = svld4 (p0, x0 + svcntb ()))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** ld4_mf8_2:
+**	incb	x0, all, mul #2
+**	ld4b	{z0\.b - z3\.b}, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld4_mf8_2, svmfloat8x4_t, mfloat8_t,
+	   z0 = svld4_mf8 (p0, x0 + svcntb () * 2),
+	   z0 = svld4 (p0, x0 + svcntb () * 2))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** ld4_mf8_3:
+**	incb	x0, all, mul #3
+**	ld4b	{z0\.b - z3\.b}, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld4_mf8_3, svmfloat8x4_t, mfloat8_t,
+	   z0 = svld4_mf8 (p0, x0 + svcntb () * 3),
+	   z0 = svld4 (p0, x0 + svcntb () * 3))
+
+/*
+** ld4_mf8_4:
+**	ld4b	{z0\.b - z3\.b}, p0/z, \[x0, #4, mul vl\]
+**	ret
+*/
+TEST_LOAD (ld4_mf8_4, svmfloat8x4_t, mfloat8_t,
+	   z0 = svld4_mf8 (p0, x0 + svcntb () * 4),
+	   z0 = svld4 (p0, x0 + svcntb () * 4))
+
+/*
+** ld4_mf8_28:
+**	ld4b	{z0\.b - z3\.b}, p0/z, \[x0, #28, mul vl\]
+**	ret
+*/
+TEST_LOAD (ld4_mf8_28, svmfloat8x4_t, mfloat8_t,
+	   z0 = svld4_mf8 (p0, x0 + svcntb () * 28),
+	   z0 = svld4 (p0, x0 + svcntb () * 28))
+
+/*
+** ld4_mf8_32:
+**	[^{]*
+**	ld4b	{z0\.b - z3\.b}, p0/z, \[x0, x[0-9]+\]
+**	ret
+*/
+TEST_LOAD (ld4_mf8_32, svmfloat8x4_t, mfloat8_t,
+	   z0 = svld4_mf8 (p0, x0 + svcntb () * 32),
+	   z0 = svld4 (p0, x0 + svcntb () * 32))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** ld4_mf8_m1:
+**	decb	x0
+**	ld4b	{z0\.b - z3\.b}, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld4_mf8_m1, svmfloat8x4_t, mfloat8_t,
+	   z0 = svld4_mf8 (p0, x0 - svcntb ()),
+	   z0 = svld4 (p0, x0 - svcntb ()))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** ld4_mf8_m2:
+**	decb	x0, all, mul #2
+**	ld4b	{z0\.b - z3\.b}, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld4_mf8_m2, svmfloat8x4_t, mfloat8_t,
+	   z0 = svld4_mf8 (p0, x0 - svcntb () * 2),
+	   z0 = svld4 (p0, x0 - svcntb () * 2))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** ld4_mf8_m3:
+**	decb	x0, all, mul #3
+**	ld4b	{z0\.b - z3\.b}, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld4_mf8_m3, svmfloat8x4_t, mfloat8_t,
+	   z0 = svld4_mf8 (p0, x0 - svcntb () * 3),
+	   z0 = svld4 (p0, x0 - svcntb () * 3))
+
+/*
+** ld4_mf8_m4:
+**	ld4b	{z0\.b - z3\.b}, p0/z, \[x0, #-4, mul vl\]
+**	ret
+*/
+TEST_LOAD (ld4_mf8_m4, svmfloat8x4_t, mfloat8_t,
+	   z0 = svld4_mf8 (p0, x0 - svcntb () * 4),
+	   z0 = svld4 (p0, x0 - svcntb () * 4))
+
+/*
+** ld4_mf8_m32:
+**	ld4b	{z0\.b - z3\.b}, p0/z, \[x0, #-32, mul vl\]
+**	ret
+*/
+TEST_LOAD (ld4_mf8_m32, svmfloat8x4_t, mfloat8_t,
+	   z0 = svld4_mf8 (p0, x0 - svcntb () * 32),
+	   z0 = svld4 (p0, x0 - svcntb () * 32))
+
+/*
+** ld4_mf8_m36:
+**	[^{]*
+**	ld4b	{z0\.b - z3\.b}, p0/z, \[x0, x[0-9]+\]
+**	ret
+*/
+TEST_LOAD (ld4_mf8_m36, svmfloat8x4_t, mfloat8_t,
+	   z0 = svld4_mf8 (p0, x0 - svcntb () * 36),
+	   z0 = svld4 (p0, x0 - svcntb () * 36))
+
+/*
+** ld4_vnum_mf8_0:
+**	ld4b	{z0\.b - z3\.b}, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld4_vnum_mf8_0, svmfloat8x4_t, mfloat8_t,
+	   z0 = svld4_vnum_mf8 (p0, x0, 0),
+	   z0 = svld4_vnum (p0, x0, 0))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** ld4_vnum_mf8_1:
+**	incb	x0
+**	ld4b	{z0\.b - z3\.b}, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld4_vnum_mf8_1, svmfloat8x4_t, mfloat8_t,
+	   z0 = svld4_vnum_mf8 (p0, x0, 1),
+	   z0 = svld4_vnum (p0, x0, 1))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** ld4_vnum_mf8_2:
+**	incb	x0, all, mul #2
+**	ld4b	{z0\.b - z3\.b}, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld4_vnum_mf8_2, svmfloat8x4_t, mfloat8_t,
+	   z0 = svld4_vnum_mf8 (p0, x0, 2),
+	   z0 = svld4_vnum (p0, x0, 2))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** ld4_vnum_mf8_3:
+**	incb	x0, all, mul #3
+**	ld4b	{z0\.b - z3\.b}, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld4_vnum_mf8_3, svmfloat8x4_t, mfloat8_t,
+	   z0 = svld4_vnum_mf8 (p0, x0, 3),
+	   z0 = svld4_vnum (p0, x0, 3))
+
+/*
+** ld4_vnum_mf8_4:
+**	ld4b	{z0\.b - z3\.b}, p0/z, \[x0, #4, mul vl\]
+**	ret
+*/
+TEST_LOAD (ld4_vnum_mf8_4, svmfloat8x4_t, mfloat8_t,
+	   z0 = svld4_vnum_mf8 (p0, x0, 4),
+	   z0 = svld4_vnum (p0, x0, 4))
+
+/*
+** ld4_vnum_mf8_28:
+**	ld4b	{z0\.b - z3\.b}, p0/z, \[x0, #28, mul vl\]
+**	ret
+*/
+TEST_LOAD (ld4_vnum_mf8_28, svmfloat8x4_t, mfloat8_t,
+	   z0 = svld4_vnum_mf8 (p0, x0, 28),
+	   z0 = svld4_vnum (p0, x0, 28))
+
+/*
+** ld4_vnum_mf8_32:
+**	[^{]*
+**	ld4b	{z0\.b - z3\.b}, p0/z, \[x0, x[0-9]+\]
+**	ret
+*/
+TEST_LOAD (ld4_vnum_mf8_32, svmfloat8x4_t, mfloat8_t,
+	   z0 = svld4_vnum_mf8 (p0, x0, 32),
+	   z0 = svld4_vnum (p0, x0, 32))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** ld4_vnum_mf8_m1:
+**	decb	x0
+**	ld4b	{z0\.b - z3\.b}, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld4_vnum_mf8_m1, svmfloat8x4_t, mfloat8_t,
+	   z0 = svld4_vnum_mf8 (p0, x0, -1),
+	   z0 = svld4_vnum (p0, x0, -1))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** ld4_vnum_mf8_m2:
+**	decb	x0, all, mul #2
+**	ld4b	{z0\.b - z3\.b}, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld4_vnum_mf8_m2, svmfloat8x4_t, mfloat8_t,
+	   z0 = svld4_vnum_mf8 (p0, x0, -2),
+	   z0 = svld4_vnum (p0, x0, -2))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** ld4_vnum_mf8_m3:
+**	decb	x0, all, mul #3
+**	ld4b	{z0\.b - z3\.b}, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ld4_vnum_mf8_m3, svmfloat8x4_t, mfloat8_t,
+	   z0 = svld4_vnum_mf8 (p0, x0, -3),
+	   z0 = svld4_vnum (p0, x0, -3))
+
+/*
+** ld4_vnum_mf8_m4:
+**	ld4b	{z0\.b - z3\.b}, p0/z, \[x0, #-4, mul vl\]
+**	ret
+*/
+TEST_LOAD (ld4_vnum_mf8_m4, svmfloat8x4_t, mfloat8_t,
+	   z0 = svld4_vnum_mf8 (p0, x0, -4),
+	   z0 = svld4_vnum (p0, x0, -4))
+
+/*
+** ld4_vnum_mf8_m32:
+**	ld4b	{z0\.b - z3\.b}, p0/z, \[x0, #-32, mul vl\]
+**	ret
+*/
+TEST_LOAD (ld4_vnum_mf8_m32, svmfloat8x4_t, mfloat8_t,
+	   z0 = svld4_vnum_mf8 (p0, x0, -32),
+	   z0 = svld4_vnum (p0, x0, -32))
+
+/*
+** ld4_vnum_mf8_m36:
+**	[^{]*
+**	ld4b	{z0\.b - z3\.b}, p0/z, \[x0, x[0-9]+\]
+**	ret
+*/
+TEST_LOAD (ld4_vnum_mf8_m36, svmfloat8x4_t, mfloat8_t,
+	   z0 = svld4_vnum_mf8 (p0, x0, -36),
+	   z0 = svld4_vnum (p0, x0, -36))
+
+/*
+** ld4_vnum_mf8_x1:
+**	cntb	(x[0-9]+)
+** (
+**	madd	(x[0-9]+), (?:x1, \1|\1, x1), x0
+**	ld4b	{z0\.b - z3\.b}, p0/z, \[\2\]
+** |
+**	mul	(x[0-9]+), (?:x1, \1|\1, x1)
+**	ld4b	{z0\.b - z3\.b}, p0/z, \[x0, \3\]
+** )
+**	ret
+*/
+TEST_LOAD (ld4_vnum_mf8_x1, svmfloat8x4_t, mfloat8_t,
+	   z0 = svld4_vnum_mf8 (p0, x0, x1),
+	   z0 = svld4_vnum (p0, x0, x1))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ldff1_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ldff1_mf8.c
new file mode 100644
index 00000000000..45cdf4168fb
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ldff1_mf8.c
@@ -0,0 +1,91 @@
+/* { dg-skip-if "" { *-*-* } { "-DSTREAMING_COMPATIBLE" } { "" } } */
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" { target { ! ilp32 } } } } */
+
+#include "test_sve_acle.h"
+
+/*
+** ldff1_mf8_base:
+**	ldff1b	z0\.b, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ldff1_mf8_base, svmfloat8_t, mfloat8_t,
+	   z0 = svldff1_mf8 (p0, x0),
+	   z0 = svldff1 (p0, x0))
+
+/*
+** ldff1_mf8_index:
+**	ldff1b	z0\.b, p0/z, \[x0, x1\]
+**	ret
+*/
+TEST_LOAD (ldff1_mf8_index, svmfloat8_t, mfloat8_t,
+	   z0 = svldff1_mf8 (p0, x0 + x1),
+	   z0 = svldff1 (p0, x0 + x1))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** ldff1_mf8_1:
+**	incb	x0
+**	ldff1b	z0\.b, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ldff1_mf8_1, svmfloat8_t, mfloat8_t,
+	   z0 = svldff1_mf8 (p0, x0 + svcntb ()),
+	   z0 = svldff1 (p0, x0 + svcntb ()))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** ldff1_mf8_m1:
+**	decb	x0
+**	ldff1b	z0\.b, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ldff1_mf8_m1, svmfloat8_t, mfloat8_t,
+	   z0 = svldff1_mf8 (p0, x0 - svcntb ()),
+	   z0 = svldff1 (p0, x0 - svcntb ()))
+
+/*
+** ldff1_vnum_mf8_0:
+**	ldff1b	z0\.b, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ldff1_vnum_mf8_0, svmfloat8_t, mfloat8_t,
+	   z0 = svldff1_vnum_mf8 (p0, x0, 0),
+	   z0 = svldff1_vnum (p0, x0, 0))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** ldff1_vnum_mf8_1:
+**	incb	x0
+**	ldff1b	z0\.b, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ldff1_vnum_mf8_1, svmfloat8_t, mfloat8_t,
+	   z0 = svldff1_vnum_mf8 (p0, x0, 1),
+	   z0 = svldff1_vnum (p0, x0, 1))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** ldff1_vnum_mf8_m1:
+**	decb	x0
+**	ldff1b	z0\.b, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ldff1_vnum_mf8_m1, svmfloat8_t, mfloat8_t,
+	   z0 = svldff1_vnum_mf8 (p0, x0, -1),
+	   z0 = svldff1_vnum (p0, x0, -1))
+
+/*
+** ldff1_vnum_mf8_x1:
+**	cntb	(x[0-9]+)
+** (
+**	madd	(x[0-9]+), (?:x1, \1|\1, x1), x0
+**	ldff1b	z0\.b, p0/z, \[\2\]
+** |
+**	mul	(x[0-9]+), (?:x1, \1|\1, x1)
+**	ldff1b	z0\.b, p0/z, \[x0, \3\]
+** )
+**	ret
+*/
+TEST_LOAD (ldff1_vnum_mf8_x1, svmfloat8_t, mfloat8_t,
+	   z0 = svldff1_vnum_mf8 (p0, x0, x1),
+	   z0 = svldff1_vnum (p0, x0, x1))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ldnf1_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ldnf1_mf8.c
new file mode 100644
index 00000000000..a5054e9047e
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ldnf1_mf8.c
@@ -0,0 +1,155 @@
+/* { dg-skip-if "" { *-*-* } { "-DSTREAMING_COMPATIBLE" } { "" } } */
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" { target { ! ilp32 } } } } */
+
+#include "test_sve_acle.h"
+
+/*
+** ldnf1_mf8_base:
+**	ldnf1b	z0\.b, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ldnf1_mf8_base, svmfloat8_t, mfloat8_t,
+	   z0 = svldnf1_mf8 (p0, x0),
+	   z0 = svldnf1 (p0, x0))
+
+/*
+** ldnf1_mf8_index:
+**	add	(x[0-9]+), x0, x1
+**	ldnf1b	z0\.b, p0/z, \[\1\]
+**	ret
+*/
+TEST_LOAD (ldnf1_mf8_index, svmfloat8_t, mfloat8_t,
+	   z0 = svldnf1_mf8 (p0, x0 + x1),
+	   z0 = svldnf1 (p0, x0 + x1))
+
+/*
+** ldnf1_mf8_1:
+**	ldnf1b	z0\.b, p0/z, \[x0, #1, mul vl\]
+**	ret
+*/
+TEST_LOAD (ldnf1_mf8_1, svmfloat8_t, mfloat8_t,
+	   z0 = svldnf1_mf8 (p0, x0 + svcntb ()),
+	   z0 = svldnf1 (p0, x0 + svcntb ()))
+
+/*
+** ldnf1_mf8_7:
+**	ldnf1b	z0\.b, p0/z, \[x0, #7, mul vl\]
+**	ret
+*/
+TEST_LOAD (ldnf1_mf8_7, svmfloat8_t, mfloat8_t,
+	   z0 = svldnf1_mf8 (p0, x0 + svcntb () * 7),
+	   z0 = svldnf1 (p0, x0 + svcntb () * 7))
+
+/*
+** ldnf1_mf8_8:
+**	incb	x0, all, mul #8
+**	ldnf1b	z0\.b, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ldnf1_mf8_8, svmfloat8_t, mfloat8_t,
+	   z0 = svldnf1_mf8 (p0, x0 + svcntb () * 8),
+	   z0 = svldnf1 (p0, x0 + svcntb () * 8))
+
+/*
+** ldnf1_mf8_m1:
+**	ldnf1b	z0\.b, p0/z, \[x0, #-1, mul vl\]
+**	ret
+*/
+TEST_LOAD (ldnf1_mf8_m1, svmfloat8_t, mfloat8_t,
+	   z0 = svldnf1_mf8 (p0, x0 - svcntb ()),
+	   z0 = svldnf1 (p0, x0 - svcntb ()))
+
+/*
+** ldnf1_mf8_m8:
+**	ldnf1b	z0\.b, p0/z, \[x0, #-8, mul vl\]
+**	ret
+*/
+TEST_LOAD (ldnf1_mf8_m8, svmfloat8_t, mfloat8_t,
+	   z0 = svldnf1_mf8 (p0, x0 - svcntb () * 8),
+	   z0 = svldnf1 (p0, x0 - svcntb () * 8))
+
+/*
+** ldnf1_mf8_m9:
+**	decb	x0, all, mul #9
+**	ldnf1b	z0\.b, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ldnf1_mf8_m9, svmfloat8_t, mfloat8_t,
+	   z0 = svldnf1_mf8 (p0, x0 - svcntb () * 9),
+	   z0 = svldnf1 (p0, x0 - svcntb () * 9))
+
+/*
+** ldnf1_vnum_mf8_0:
+**	ldnf1b	z0\.b, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ldnf1_vnum_mf8_0, svmfloat8_t, mfloat8_t,
+	   z0 = svldnf1_vnum_mf8 (p0, x0, 0),
+	   z0 = svldnf1_vnum (p0, x0, 0))
+
+/*
+** ldnf1_vnum_mf8_1:
+**	ldnf1b	z0\.b, p0/z, \[x0, #1, mul vl\]
+**	ret
+*/
+TEST_LOAD (ldnf1_vnum_mf8_1, svmfloat8_t, mfloat8_t,
+	   z0 = svldnf1_vnum_mf8 (p0, x0, 1),
+	   z0 = svldnf1_vnum (p0, x0, 1))
+
+/*
+** ldnf1_vnum_mf8_7:
+**	ldnf1b	z0\.b, p0/z, \[x0, #7, mul vl\]
+**	ret
+*/
+TEST_LOAD (ldnf1_vnum_mf8_7, svmfloat8_t, mfloat8_t,
+	   z0 = svldnf1_vnum_mf8 (p0, x0, 7),
+	   z0 = svldnf1_vnum (p0, x0, 7))
+
+/*
+** ldnf1_vnum_mf8_8:
+**	incb	x0, all, mul #8
+**	ldnf1b	z0\.b, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ldnf1_vnum_mf8_8, svmfloat8_t, mfloat8_t,
+	   z0 = svldnf1_vnum_mf8 (p0, x0, 8),
+	   z0 = svldnf1_vnum (p0, x0, 8))
+
+/*
+** ldnf1_vnum_mf8_m1:
+**	ldnf1b	z0\.b, p0/z, \[x0, #-1, mul vl\]
+**	ret
+*/
+TEST_LOAD (ldnf1_vnum_mf8_m1, svmfloat8_t, mfloat8_t,
+	   z0 = svldnf1_vnum_mf8 (p0, x0, -1),
+	   z0 = svldnf1_vnum (p0, x0, -1))
+
+/*
+** ldnf1_vnum_mf8_m8:
+**	ldnf1b	z0\.b, p0/z, \[x0, #-8, mul vl\]
+**	ret
+*/
+TEST_LOAD (ldnf1_vnum_mf8_m8, svmfloat8_t, mfloat8_t,
+	   z0 = svldnf1_vnum_mf8 (p0, x0, -8),
+	   z0 = svldnf1_vnum (p0, x0, -8))
+
+/*
+** ldnf1_vnum_mf8_m9:
+**	decb	x0, all, mul #9
+**	ldnf1b	z0\.b, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ldnf1_vnum_mf8_m9, svmfloat8_t, mfloat8_t,
+	   z0 = svldnf1_vnum_mf8 (p0, x0, -9),
+	   z0 = svldnf1_vnum (p0, x0, -9))
+
+/*
+** ldnf1_vnum_mf8_x1:
+**	cntb	(x[0-9]+)
+**	madd	(x[0-9]+), (?:x1, \1|\1, x1), x0
+**	ldnf1b	z0\.b, p0/z, \[\2\]
+**	ret
+*/
+TEST_LOAD (ldnf1_vnum_mf8_x1, svmfloat8_t, mfloat8_t,
+	   z0 = svldnf1_vnum_mf8 (p0, x0, x1),
+	   z0 = svldnf1_vnum (p0, x0, x1))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ldnt1_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ldnt1_mf8.c
new file mode 100644
index 00000000000..dbfd9ae83d4
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/ldnt1_mf8.c
@@ -0,0 +1,162 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" { target { ! ilp32 } } } } */
+
+#include "test_sve_acle.h"
+
+/*
+** ldnt1_mf8_base:
+**	ldnt1b	z0\.b, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ldnt1_mf8_base, svmfloat8_t, mfloat8_t,
+	   z0 = svldnt1_mf8 (p0, x0),
+	   z0 = svldnt1 (p0, x0))
+
+/*
+** ldnt1_mf8_index:
+**	ldnt1b	z0\.b, p0/z, \[x0, x1\]
+**	ret
+*/
+TEST_LOAD (ldnt1_mf8_index, svmfloat8_t, mfloat8_t,
+	   z0 = svldnt1_mf8 (p0, x0 + x1),
+	   z0 = svldnt1 (p0, x0 + x1))
+
+/*
+** ldnt1_mf8_1:
+**	ldnt1b	z0\.b, p0/z, \[x0, #1, mul vl\]
+**	ret
+*/
+TEST_LOAD (ldnt1_mf8_1, svmfloat8_t, mfloat8_t,
+	   z0 = svldnt1_mf8 (p0, x0 + svcntb ()),
+	   z0 = svldnt1 (p0, x0 + svcntb ()))
+
+/*
+** ldnt1_mf8_7:
+**	ldnt1b	z0\.b, p0/z, \[x0, #7, mul vl\]
+**	ret
+*/
+TEST_LOAD (ldnt1_mf8_7, svmfloat8_t, mfloat8_t,
+	   z0 = svldnt1_mf8 (p0, x0 + svcntb () * 7),
+	   z0 = svldnt1 (p0, x0 + svcntb () * 7))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** ldnt1_mf8_8:
+**	incb	x0, all, mul #8
+**	ldnt1b	z0\.b, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ldnt1_mf8_8, svmfloat8_t, mfloat8_t,
+	   z0 = svldnt1_mf8 (p0, x0 + svcntb () * 8),
+	   z0 = svldnt1 (p0, x0 + svcntb () * 8))
+
+/*
+** ldnt1_mf8_m1:
+**	ldnt1b	z0\.b, p0/z, \[x0, #-1, mul vl\]
+**	ret
+*/
+TEST_LOAD (ldnt1_mf8_m1, svmfloat8_t, mfloat8_t,
+	   z0 = svldnt1_mf8 (p0, x0 - svcntb ()),
+	   z0 = svldnt1 (p0, x0 - svcntb ()))
+
+/*
+** ldnt1_mf8_m8:
+**	ldnt1b	z0\.b, p0/z, \[x0, #-8, mul vl\]
+**	ret
+*/
+TEST_LOAD (ldnt1_mf8_m8, svmfloat8_t, mfloat8_t,
+	   z0 = svldnt1_mf8 (p0, x0 - svcntb () * 8),
+	   z0 = svldnt1 (p0, x0 - svcntb () * 8))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** ldnt1_mf8_m9:
+**	decb	x0, all, mul #9
+**	ldnt1b	z0\.b, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ldnt1_mf8_m9, svmfloat8_t, mfloat8_t,
+	   z0 = svldnt1_mf8 (p0, x0 - svcntb () * 9),
+	   z0 = svldnt1 (p0, x0 - svcntb () * 9))
+
+/*
+** ldnt1_vnum_mf8_0:
+**	ldnt1b	z0\.b, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ldnt1_vnum_mf8_0, svmfloat8_t, mfloat8_t,
+	   z0 = svldnt1_vnum_mf8 (p0, x0, 0),
+	   z0 = svldnt1_vnum (p0, x0, 0))
+
+/*
+** ldnt1_vnum_mf8_1:
+**	ldnt1b	z0\.b, p0/z, \[x0, #1, mul vl\]
+**	ret
+*/
+TEST_LOAD (ldnt1_vnum_mf8_1, svmfloat8_t, mfloat8_t,
+	   z0 = svldnt1_vnum_mf8 (p0, x0, 1),
+	   z0 = svldnt1_vnum (p0, x0, 1))
+
+/*
+** ldnt1_vnum_mf8_7:
+**	ldnt1b	z0\.b, p0/z, \[x0, #7, mul vl\]
+**	ret
+*/
+TEST_LOAD (ldnt1_vnum_mf8_7, svmfloat8_t, mfloat8_t,
+	   z0 = svldnt1_vnum_mf8 (p0, x0, 7),
+	   z0 = svldnt1_vnum (p0, x0, 7))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** ldnt1_vnum_mf8_8:
+**	incb	x0, all, mul #8
+**	ldnt1b	z0\.b, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ldnt1_vnum_mf8_8, svmfloat8_t, mfloat8_t,
+	   z0 = svldnt1_vnum_mf8 (p0, x0, 8),
+	   z0 = svldnt1_vnum (p0, x0, 8))
+
+/*
+** ldnt1_vnum_mf8_m1:
+**	ldnt1b	z0\.b, p0/z, \[x0, #-1, mul vl\]
+**	ret
+*/
+TEST_LOAD (ldnt1_vnum_mf8_m1, svmfloat8_t, mfloat8_t,
+	   z0 = svldnt1_vnum_mf8 (p0, x0, -1),
+	   z0 = svldnt1_vnum (p0, x0, -1))
+
+/*
+** ldnt1_vnum_mf8_m8:
+**	ldnt1b	z0\.b, p0/z, \[x0, #-8, mul vl\]
+**	ret
+*/
+TEST_LOAD (ldnt1_vnum_mf8_m8, svmfloat8_t, mfloat8_t,
+	   z0 = svldnt1_vnum_mf8 (p0, x0, -8),
+	   z0 = svldnt1_vnum (p0, x0, -8))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** ldnt1_vnum_mf8_m9:
+**	decb	x0, all, mul #9
+**	ldnt1b	z0\.b, p0/z, \[x0\]
+**	ret
+*/
+TEST_LOAD (ldnt1_vnum_mf8_m9, svmfloat8_t, mfloat8_t,
+	   z0 = svldnt1_vnum_mf8 (p0, x0, -9),
+	   z0 = svldnt1_vnum (p0, x0, -9))
+
+/*
+** ldnt1_vnum_mf8_x1:
+**	cntb	(x[0-9]+)
+** (
+**	madd	(x[0-9]+), (?:x1, \1|\1, x1), x0
+**	ldnt1b	z0\.b, p0/z, \[\2\]
+** |
+**	mul	(x[0-9]+), (?:x1, \1|\1, x1)
+**	ldnt1b	z0\.b, p0/z, \[x0, \3\]
+** )
+**	ret
+*/
+TEST_LOAD (ldnt1_vnum_mf8_x1, svmfloat8_t, mfloat8_t,
+	   z0 = svldnt1_vnum_mf8 (p0, x0, x1),
+	   z0 = svldnt1_vnum (p0, x0, x1))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/len_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/len_mf8.c
new file mode 100644
index 00000000000..c8730c6886a
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/len_mf8.c
@@ -0,0 +1,12 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** len_x0_mf8:
+**	cntb	x0
+**	ret
+*/
+TEST_REDUCTION_X (len_x0_mf8, uint64_t, svmfloat8_t,
+		  x0 = svlen_mf8 (z0),
+		  x0 = svlen (z0))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_bf16.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_bf16.c
index dd0daf2eff0..e745b2500dc 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_bf16.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_bf16.c
@@ -2,6 +2,23 @@
 
 #include "test_sve_acle.h"
 
+/*
+** reinterpret_bf16_mf8_tied1:
+**	ret
+*/
+TEST_DUAL_Z_REV (reinterpret_bf16_mf8_tied1, svbfloat16_t, svmfloat8_t,
+		 z0_res = svreinterpret_bf16_mf8 (z0),
+		 z0_res = svreinterpret_bf16 (z0))
+
+/*
+** reinterpret_bf16_mf8_untied:
+**	mov	z0\.d, z4\.d
+**	ret
+*/
+TEST_DUAL_Z (reinterpret_bf16_mf8_untied, svbfloat16_t, svmfloat8_t,
+	     z0 = svreinterpret_bf16_mf8 (z4),
+	     z0 = svreinterpret_bf16 (z4))
+
 /*
 ** reinterpret_bf16_bf16_tied1:
 **	ret
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_f16.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_f16.c
index 9b6f8227d2a..75dcf300b75 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_f16.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_f16.c
@@ -2,6 +2,23 @@
 
 #include "test_sve_acle.h"
 
+/*
+** reinterpret_f16_mf8_tied1:
+**	ret
+*/
+TEST_DUAL_Z_REV (reinterpret_f16_mf8_tied1, svfloat16_t, svmfloat8_t,
+		 z0_res = svreinterpret_f16_mf8 (z0),
+		 z0_res = svreinterpret_f16 (z0))
+
+/*
+** reinterpret_f16_mf8_untied:
+**	mov	z0\.d, z4\.d
+**	ret
+*/
+TEST_DUAL_Z (reinterpret_f16_mf8_untied, svfloat16_t, svmfloat8_t,
+	     z0 = svreinterpret_f16_mf8 (z4),
+	     z0 = svreinterpret_f16 (z4))
+
 /*
 ** reinterpret_f16_bf16_tied1:
 **	ret
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_f32.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_f32.c
index ce981fce9d8..4bf7860b9dc 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_f32.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_f32.c
@@ -2,6 +2,23 @@
 
 #include "test_sve_acle.h"
 
+/*
+** reinterpret_f32_mf8_tied1:
+**	ret
+*/
+TEST_DUAL_Z_REV (reinterpret_f32_mf8_tied1, svfloat32_t, svmfloat8_t,
+		 z0_res = svreinterpret_f32_mf8 (z0),
+		 z0_res = svreinterpret_f32 (z0))
+
+/*
+** reinterpret_f32_mf8_untied:
+**	mov	z0\.d, z4\.d
+**	ret
+*/
+TEST_DUAL_Z (reinterpret_f32_mf8_untied, svfloat32_t, svmfloat8_t,
+	     z0 = svreinterpret_f32_mf8 (z4),
+	     z0 = svreinterpret_f32 (z4))
+
 /*
 ** reinterpret_f32_bf16_tied1:
 **	ret
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_f64.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_f64.c
index 4f51824ab7e..f4012fa54aa 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_f64.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_f64.c
@@ -2,6 +2,23 @@
 
 #include "test_sve_acle.h"
 
+/*
+** reinterpret_f64_mf8_tied1:
+**	ret
+*/
+TEST_DUAL_Z_REV (reinterpret_f64_mf8_tied1, svfloat64_t, svmfloat8_t,
+		 z0_res = svreinterpret_f64_mf8 (z0),
+		 z0_res = svreinterpret_f64 (z0))
+
+/*
+** reinterpret_f64_mf8_untied:
+**	mov	z0\.d, z4\.d
+**	ret
+*/
+TEST_DUAL_Z (reinterpret_f64_mf8_untied, svfloat64_t, svmfloat8_t,
+	     z0 = svreinterpret_f64_mf8 (z4),
+	     z0 = svreinterpret_f64 (z4))
+
 /*
 ** reinterpret_f64_bf16_tied1:
 **	ret
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_mf8.c
new file mode 100644
index 00000000000..dcd4978dc92
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_mf8.c
@@ -0,0 +1,297 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** reinterpret_mf8_mf8_tied1:
+**	ret
+*/
+TEST_DUAL_Z_REV (reinterpret_mf8_mf8_tied1, svmfloat8_t, svmfloat8_t,
+		 z0_res = svreinterpret_mf8_mf8 (z0),
+		 z0_res = svreinterpret_mf8 (z0))
+
+/*
+** reinterpret_mf8_mf8_untied:
+**	mov	z0\.d, z4\.d
+**	ret
+*/
+TEST_DUAL_Z (reinterpret_mf8_mf8_untied, svmfloat8_t, svmfloat8_t,
+	     z0 = svreinterpret_mf8_mf8 (z4),
+	     z0 = svreinterpret_mf8 (z4))
+
+/*
+** reinterpret_mf8_bf16_tied1:
+**	ret
+*/
+TEST_DUAL_Z_REV (reinterpret_mf8_bf16_tied1, svmfloat8_t, svbfloat16_t,
+		 z0_res = svreinterpret_mf8_bf16 (z0),
+		 z0_res = svreinterpret_mf8 (z0))
+
+/*
+** reinterpret_mf8_bf16_untied:
+**	mov	z0\.d, z4\.d
+**	ret
+*/
+TEST_DUAL_Z (reinterpret_mf8_bf16_untied, svmfloat8_t, svbfloat16_t,
+	     z0 = svreinterpret_mf8_bf16 (z4),
+	     z0 = svreinterpret_mf8 (z4))
+
+/*
+** reinterpret_mf8_f16_tied1:
+**	ret
+*/
+TEST_DUAL_Z_REV (reinterpret_mf8_f16_tied1, svmfloat8_t, svfloat16_t,
+		 z0_res = svreinterpret_mf8_f16 (z0),
+		 z0_res = svreinterpret_mf8 (z0))
+
+/*
+** reinterpret_mf8_f16_untied:
+**	mov	z0\.d, z4\.d
+**	ret
+*/
+TEST_DUAL_Z (reinterpret_mf8_f16_untied, svmfloat8_t, svfloat16_t,
+	     z0 = svreinterpret_mf8_f16 (z4),
+	     z0 = svreinterpret_mf8 (z4))
+
+/*
+** reinterpret_mf8_f32_tied1:
+**	ret
+*/
+TEST_DUAL_Z_REV (reinterpret_mf8_f32_tied1, svmfloat8_t, svfloat32_t,
+		 z0_res = svreinterpret_mf8_f32 (z0),
+		 z0_res = svreinterpret_mf8 (z0))
+
+/*
+** reinterpret_mf8_f32_untied:
+**	mov	z0\.d, z4\.d
+**	ret
+*/
+TEST_DUAL_Z (reinterpret_mf8_f32_untied, svmfloat8_t, svfloat32_t,
+	     z0 = svreinterpret_mf8_f32 (z4),
+	     z0 = svreinterpret_mf8 (z4))
+
+/*
+** reinterpret_mf8_f64_tied1:
+**	ret
+*/
+TEST_DUAL_Z_REV (reinterpret_mf8_f64_tied1, svmfloat8_t, svfloat64_t,
+		 z0_res = svreinterpret_mf8_f64 (z0),
+		 z0_res = svreinterpret_mf8 (z0))
+
+/*
+** reinterpret_mf8_f64_untied:
+**	mov	z0\.d, z4\.d
+**	ret
+*/
+TEST_DUAL_Z (reinterpret_mf8_f64_untied, svmfloat8_t, svfloat64_t,
+	     z0 = svreinterpret_mf8_f64 (z4),
+	     z0 = svreinterpret_mf8 (z4))
+
+/*
+** reinterpret_mf8_s8_tied1:
+**	ret
+*/
+TEST_DUAL_Z_REV (reinterpret_mf8_s8_tied1, svmfloat8_t, svint8_t,
+		 z0_res = svreinterpret_mf8_s8 (z0),
+		 z0_res = svreinterpret_mf8 (z0))
+
+/*
+** reinterpret_mf8_s8_untied:
+**	mov	z0\.d, z4\.d
+**	ret
+*/
+TEST_DUAL_Z (reinterpret_mf8_s8_untied, svmfloat8_t, svint8_t,
+	     z0 = svreinterpret_mf8_s8 (z4),
+	     z0 = svreinterpret_mf8 (z4))
+
+/*
+** reinterpret_mf8_s16_tied1:
+**	ret
+*/
+TEST_DUAL_Z_REV (reinterpret_mf8_s16_tied1, svmfloat8_t, svint16_t,
+		 z0_res = svreinterpret_mf8_s16 (z0),
+		 z0_res = svreinterpret_mf8 (z0))
+
+/*
+** reinterpret_mf8_s16_untied:
+**	mov	z0\.d, z4\.d
+**	ret
+*/
+TEST_DUAL_Z (reinterpret_mf8_s16_untied, svmfloat8_t, svint16_t,
+	     z0 = svreinterpret_mf8_s16 (z4),
+	     z0 = svreinterpret_mf8 (z4))
+
+/*
+** reinterpret_mf8_s32_tied1:
+**	ret
+*/
+TEST_DUAL_Z_REV (reinterpret_mf8_s32_tied1, svmfloat8_t, svint32_t,
+		 z0_res = svreinterpret_mf8_s32 (z0),
+		 z0_res = svreinterpret_mf8 (z0))
+
+/*
+** reinterpret_mf8_s32_untied:
+**	mov	z0\.d, z4\.d
+**	ret
+*/
+TEST_DUAL_Z (reinterpret_mf8_s32_untied, svmfloat8_t, svint32_t,
+	     z0 = svreinterpret_mf8_s32 (z4),
+	     z0 = svreinterpret_mf8 (z4))
+
+/*
+** reinterpret_mf8_s64_tied1:
+**	ret
+*/
+TEST_DUAL_Z_REV (reinterpret_mf8_s64_tied1, svmfloat8_t, svint64_t,
+		 z0_res = svreinterpret_mf8_s64 (z0),
+		 z0_res = svreinterpret_mf8 (z0))
+
+/*
+** reinterpret_mf8_s64_untied:
+**	mov	z0\.d, z4\.d
+**	ret
+*/
+TEST_DUAL_Z (reinterpret_mf8_s64_untied, svmfloat8_t, svint64_t,
+	     z0 = svreinterpret_mf8_s64 (z4),
+	     z0 = svreinterpret_mf8 (z4))
+
+/*
+** reinterpret_mf8_u8_tied1:
+**	ret
+*/
+TEST_DUAL_Z_REV (reinterpret_mf8_u8_tied1, svmfloat8_t, svuint8_t,
+		 z0_res = svreinterpret_mf8_u8 (z0),
+		 z0_res = svreinterpret_mf8 (z0))
+
+/*
+** reinterpret_mf8_u8_untied:
+**	mov	z0\.d, z4\.d
+**	ret
+*/
+TEST_DUAL_Z (reinterpret_mf8_u8_untied, svmfloat8_t, svuint8_t,
+	     z0 = svreinterpret_mf8_u8 (z4),
+	     z0 = svreinterpret_mf8 (z4))
+
+/*
+** reinterpret_mf8_u16_tied1:
+**	ret
+*/
+TEST_DUAL_Z_REV (reinterpret_mf8_u16_tied1, svmfloat8_t, svuint16_t,
+		 z0_res = svreinterpret_mf8_u16 (z0),
+		 z0_res = svreinterpret_mf8 (z0))
+
+/*
+** reinterpret_mf8_u16_untied:
+**	mov	z0\.d, z4\.d
+**	ret
+*/
+TEST_DUAL_Z (reinterpret_mf8_u16_untied, svmfloat8_t, svuint16_t,
+	     z0 = svreinterpret_mf8_u16 (z4),
+	     z0 = svreinterpret_mf8 (z4))
+
+/*
+** reinterpret_mf8_u32_tied1:
+**	ret
+*/
+TEST_DUAL_Z_REV (reinterpret_mf8_u32_tied1, svmfloat8_t, svuint32_t,
+		 z0_res = svreinterpret_mf8_u32 (z0),
+		 z0_res = svreinterpret_mf8 (z0))
+
+/*
+** reinterpret_mf8_u32_untied:
+**	mov	z0\.d, z4\.d
+**	ret
+*/
+TEST_DUAL_Z (reinterpret_mf8_u32_untied, svmfloat8_t, svuint32_t,
+	     z0 = svreinterpret_mf8_u32 (z4),
+	     z0 = svreinterpret_mf8 (z4))
+
+/*
+** reinterpret_mf8_u64_tied1:
+**	ret
+*/
+TEST_DUAL_Z_REV (reinterpret_mf8_u64_tied1, svmfloat8_t, svuint64_t,
+		 z0_res = svreinterpret_mf8_u64 (z0),
+		 z0_res = svreinterpret_mf8 (z0))
+
+/*
+** reinterpret_mf8_u64_untied:
+**	mov	z0\.d, z4\.d
+**	ret
+*/
+TEST_DUAL_Z (reinterpret_mf8_u64_untied, svmfloat8_t, svuint64_t,
+	     z0 = svreinterpret_mf8_u64 (z4),
+	     z0 = svreinterpret_mf8 (z4))
+
+/*
+** reinterpret_mf8_bf16_x2_tied1:
+**	ret
+*/
+TEST_DUAL_Z_REV (reinterpret_mf8_bf16_x2_tied1, svmfloat8x2_t, svbfloat16x2_t,
+		 z0_res = svreinterpret_mf8_bf16_x2 (z0),
+		 z0_res = svreinterpret_mf8 (z0))
+
+/*
+** reinterpret_mf8_f32_x2_untied:
+** (
+**	mov	z0\.d, z4\.d
+**	mov	z1\.d, z5\.d
+** |
+**	mov	z0\.d, z4\.d
+**	mov	z1\.d, z5\.d
+** )
+**	ret
+*/
+TEST_DUAL_XN (reinterpret_mf8_f32_x2_untied, svmfloat8x2_t, svfloat32x2_t, z0,
+	      svreinterpret_mf8_f32_x2 (z4),
+	      svreinterpret_mf8 (z4))
+
+/*
+** reinterpret_mf8_mf8_x3_untied:
+**	mov	(z18|z19|z20)\.d, (z23|z24|z25)\.d
+**	mov	(z18|z19|z20)\.d, (z23|z24|z25)\.d
+**	mov	(z18|z19|z20)\.d, (z23|z24|z25)\.d
+**	ret
+*/
+TEST_DUAL_XN (reinterpret_mf8_mf8_x3_untied, svmfloat8x3_t, svmfloat8x3_t, z18,
+	      svreinterpret_mf8_mf8_x3 (z23),
+	      svreinterpret_mf8 (z23))
+
+/*
+** reinterpret_mf8_s64_x3_tied1:
+**	ret
+*/
+TEST_DUAL_Z_REV (reinterpret_mf8_s64_x3_tied1, svmfloat8x3_t, svint64x3_t,
+		 z0_res = svreinterpret_mf8_s64_x3 (z0),
+		 z0_res = svreinterpret_mf8 (z0))
+
+/*
+** reinterpret_mf8_u8_x3_untied:
+**	mov	(z18|z19|z20)\.d, (z23|z24|z25)\.d
+**	mov	(z18|z19|z20)\.d, (z23|z24|z25)\.d
+**	mov	(z18|z19|z20)\.d, (z23|z24|z25)\.d
+**	ret
+*/
+TEST_DUAL_XN (reinterpret_mf8_u8_x3_untied, svmfloat8x3_t, svuint8x3_t, z18,
+	      svreinterpret_mf8_u8_x3 (z23),
+	      svreinterpret_mf8 (z23))
+
+/*
+** reinterpret_mf8_u32_x4_tied1:
+**	ret
+*/
+TEST_DUAL_Z_REV (reinterpret_mf8_u32_x4_tied1, svmfloat8x4_t, svuint32x4_t,
+		 z0_res = svreinterpret_mf8_u32_x4 (z0),
+		 z0_res = svreinterpret_mf8 (z0))
+
+/*
+** reinterpret_mf8_f64_x4_untied:
+**	mov	(z28|z29|z30|z31)\.d, z[4-7]\.d
+**	mov	(z28|z29|z30|z31)\.d, z[4-7]\.d
+**	mov	(z28|z29|z30|z31)\.d, z[4-7]\.d
+**	mov	(z28|z29|z30|z31)\.d, z[4-7]\.d
+**	ret
+*/
+TEST_DUAL_XN (reinterpret_mf8_f64_x4_untied, svmfloat8x4_t, svfloat64x4_t, z28,
+	      svreinterpret_mf8_f64_x4 (z4),
+	      svreinterpret_mf8 (z4))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_s16.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_s16.c
index 7e15f3e9bd3..17558aa718b 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_s16.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_s16.c
@@ -2,6 +2,23 @@
 
 #include "test_sve_acle.h"
 
+/*
+** reinterpret_s16_mf8_tied1:
+**	ret
+*/
+TEST_DUAL_Z_REV (reinterpret_s16_mf8_tied1, svint16_t, svmfloat8_t,
+		 z0_res = svreinterpret_s16_mf8 (z0),
+		 z0_res = svreinterpret_s16 (z0))
+
+/*
+** reinterpret_s16_mf8_untied:
+**	mov	z0\.d, z4\.d
+**	ret
+*/
+TEST_DUAL_Z (reinterpret_s16_mf8_untied, svint16_t, svmfloat8_t,
+	     z0 = svreinterpret_s16_mf8 (z4),
+	     z0 = svreinterpret_s16 (z4))
+
 /*
 ** reinterpret_s16_bf16_tied1:
 **	ret
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_s32.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_s32.c
index 60da8aef333..c78e90e2776 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_s32.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_s32.c
@@ -2,6 +2,23 @@
 
 #include "test_sve_acle.h"
 
+/*
+** reinterpret_s32_mf8_tied1:
+**	ret
+*/
+TEST_DUAL_Z_REV (reinterpret_s32_mf8_tied1, svint32_t, svmfloat8_t,
+		 z0_res = svreinterpret_s32_mf8 (z0),
+		 z0_res = svreinterpret_s32 (z0))
+
+/*
+** reinterpret_s32_mf8_untied:
+**	mov	z0\.d, z4\.d
+**	ret
+*/
+TEST_DUAL_Z (reinterpret_s32_mf8_untied, svint32_t, svmfloat8_t,
+	     z0 = svreinterpret_s32_mf8 (z4),
+	     z0 = svreinterpret_s32 (z4))
+
 /*
 ** reinterpret_s32_bf16_tied1:
 **	ret
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_s64.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_s64.c
index d705c60dfd7..9370c4b5789 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_s64.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_s64.c
@@ -2,6 +2,23 @@
 
 #include "test_sve_acle.h"
 
+/*
+** reinterpret_s64_mf8_tied1:
+**	ret
+*/
+TEST_DUAL_Z_REV (reinterpret_s64_mf8_tied1, svint64_t, svmfloat8_t,
+		 z0_res = svreinterpret_s64_mf8 (z0),
+		 z0_res = svreinterpret_s64 (z0))
+
+/*
+** reinterpret_s64_mf8_untied:
+**	mov	z0\.d, z4\.d
+**	ret
+*/
+TEST_DUAL_Z (reinterpret_s64_mf8_untied, svint64_t, svmfloat8_t,
+	     z0 = svreinterpret_s64_mf8 (z4),
+	     z0 = svreinterpret_s64 (z4))
+
 /*
 ** reinterpret_s64_bf16_tied1:
 **	ret
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_s8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_s8.c
index ab90a54d746..46a5cd17f80 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_s8.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_s8.c
@@ -2,6 +2,23 @@
 
 #include "test_sve_acle.h"
 
+/*
+** reinterpret_s8_mf8_tied1:
+**	ret
+*/
+TEST_DUAL_Z_REV (reinterpret_s8_mf8_tied1, svint8_t, svmfloat8_t,
+		 z0_res = svreinterpret_s8_mf8 (z0),
+		 z0_res = svreinterpret_s8 (z0))
+
+/*
+** reinterpret_s8_mf8_untied:
+**	mov	z0\.d, z4\.d
+**	ret
+*/
+TEST_DUAL_Z (reinterpret_s8_mf8_untied, svint8_t, svmfloat8_t,
+	     z0 = svreinterpret_s8_mf8 (z4),
+	     z0 = svreinterpret_s8 (z4))
+
 /*
 ** reinterpret_s8_bf16_tied1:
 **	ret
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_u16.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_u16.c
index fcfc0eb9da5..d91b305fab7 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_u16.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_u16.c
@@ -2,6 +2,23 @@
 
 #include "test_sve_acle.h"
 
+/*
+** reinterpret_u16_mf8_tied1:
+**	ret
+*/
+TEST_DUAL_Z_REV (reinterpret_u16_mf8_tied1, svuint16_t, svmfloat8_t,
+		 z0_res = svreinterpret_u16_mf8 (z0),
+		 z0_res = svreinterpret_u16 (z0))
+
+/*
+** reinterpret_u16_mf8_untied:
+**	mov	z0\.d, z4\.d
+**	ret
+*/
+TEST_DUAL_Z (reinterpret_u16_mf8_untied, svuint16_t, svmfloat8_t,
+	     z0 = svreinterpret_u16_mf8 (z4),
+	     z0 = svreinterpret_u16 (z4))
+
 /*
 ** reinterpret_u16_bf16_tied1:
 **	ret
@@ -229,6 +246,17 @@ TEST_DUAL_XN (reinterpret_u16_f32_x2_untied, svuint16x2_t, svfloat32x2_t, z0,
 	      svreinterpret_u16_f32_x2 (z4),
 	      svreinterpret_u16 (z4))
 
+/*
+** reinterpret_u16_mf8_x3_untied:
+**	mov	(z18|z19|z20)\.d, (z23|z24|z25)\.d
+**	mov	(z18|z19|z20)\.d, (z23|z24|z25)\.d
+**	mov	(z18|z19|z20)\.d, (z23|z24|z25)\.d
+**	ret
+*/
+TEST_DUAL_XN (reinterpret_u16_mf8_x3_untied, svuint16x3_t, svmfloat8x3_t, z18,
+	      svreinterpret_u16_mf8_x3 (z23),
+	      svreinterpret_u16 (z23))
+
 /*
 ** reinterpret_u16_s64_x3_tied1:
 **	ret
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_u32.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_u32.c
index 6d7e05857fe..77f5abc3465 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_u32.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_u32.c
@@ -2,6 +2,23 @@
 
 #include "test_sve_acle.h"
 
+/*
+** reinterpret_u32_mf8_tied1:
+**	ret
+*/
+TEST_DUAL_Z_REV (reinterpret_u32_mf8_tied1, svuint32_t, svmfloat8_t,
+		 z0_res = svreinterpret_u32_mf8 (z0),
+		 z0_res = svreinterpret_u32 (z0))
+
+/*
+** reinterpret_u32_mf8_untied:
+**	mov	z0\.d, z4\.d
+**	ret
+*/
+TEST_DUAL_Z (reinterpret_u32_mf8_untied, svuint32_t, svmfloat8_t,
+	     z0 = svreinterpret_u32_mf8 (z4),
+	     z0 = svreinterpret_u32 (z4))
+
 /*
 ** reinterpret_u32_bf16_tied1:
 **	ret
@@ -229,6 +246,17 @@ TEST_DUAL_XN (reinterpret_u32_f32_x2_untied, svuint32x2_t, svfloat32x2_t, z0,
 	      svreinterpret_u32_f32_x2 (z4),
 	      svreinterpret_u32 (z4))
 
+/*
+** reinterpret_u32_mf8_x3_untied:
+**	mov	(z18|z19|z20)\.d, (z23|z24|z25)\.d
+**	mov	(z18|z19|z20)\.d, (z23|z24|z25)\.d
+**	mov	(z18|z19|z20)\.d, (z23|z24|z25)\.d
+**	ret
+*/
+TEST_DUAL_XN (reinterpret_u32_mf8_x3_untied, svuint32x3_t, svmfloat8x3_t, z18,
+	      svreinterpret_u32_mf8_x3 (z23),
+	      svreinterpret_u32 (z23))
+
 /*
 ** reinterpret_u32_s64_x3_tied1:
 **	ret
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_u64.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_u64.c
index 55c0baefb6f..90fb1ff8478 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_u64.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_u64.c
@@ -2,6 +2,23 @@
 
 #include "test_sve_acle.h"
 
+/*
+** reinterpret_u64_mf8_tied1:
+**	ret
+*/
+TEST_DUAL_Z_REV (reinterpret_u64_mf8_tied1, svuint64_t, svmfloat8_t,
+		 z0_res = svreinterpret_u64_mf8 (z0),
+		 z0_res = svreinterpret_u64 (z0))
+
+/*
+** reinterpret_u64_mf8_untied:
+**	mov	z0\.d, z4\.d
+**	ret
+*/
+TEST_DUAL_Z (reinterpret_u64_mf8_untied, svuint64_t, svmfloat8_t,
+	     z0 = svreinterpret_u64_mf8 (z4),
+	     z0 = svreinterpret_u64 (z4))
+
 /*
 ** reinterpret_u64_bf16_tied1:
 **	ret
@@ -229,6 +246,17 @@ TEST_DUAL_XN (reinterpret_u64_f32_x2_untied, svuint64x2_t, svfloat32x2_t, z0,
 	      svreinterpret_u64_f32_x2 (z4),
 	      svreinterpret_u64 (z4))
 
+/*
+** reinterpret_u64_mf8_x3_untied:
+**	mov	(z18|z19|z20)\.d, (z23|z24|z25)\.d
+**	mov	(z18|z19|z20)\.d, (z23|z24|z25)\.d
+**	mov	(z18|z19|z20)\.d, (z23|z24|z25)\.d
+**	ret
+*/
+TEST_DUAL_XN (reinterpret_u64_mf8_x3_untied, svuint64x3_t, svmfloat8x3_t, z18,
+	      svreinterpret_u64_mf8_x3 (z23),
+	      svreinterpret_u64 (z23))
+
 /*
 ** reinterpret_u64_s64_x3_tied1:
 **	ret
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_u8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_u8.c
index f7302196162..87500e334a1 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_u8.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/reinterpret_u8.c
@@ -2,6 +2,23 @@
 
 #include "test_sve_acle.h"
 
+/*
+** reinterpret_u8_mf8_tied1:
+**	ret
+*/
+TEST_DUAL_Z_REV (reinterpret_u8_mf8_tied1, svuint8_t, svmfloat8_t,
+		 z0_res = svreinterpret_u8_mf8 (z0),
+		 z0_res = svreinterpret_u8 (z0))
+
+/*
+** reinterpret_u8_mf8_untied:
+**	mov	z0\.d, z4\.d
+**	ret
+*/
+TEST_DUAL_Z (reinterpret_u8_mf8_untied, svuint8_t, svmfloat8_t,
+	     z0 = svreinterpret_u8_mf8 (z4),
+	     z0 = svreinterpret_u8 (z4))
+
 /*
 ** reinterpret_u8_bf16_tied1:
 **	ret
@@ -214,6 +231,17 @@ TEST_DUAL_Z_REV (reinterpret_u8_bf16_x2_tied1, svuint8x2_t, svbfloat16x2_t,
 		 z0_res = svreinterpret_u8_bf16_x2 (z0),
 		 z0_res = svreinterpret_u8 (z0))
 
+/*
+** reinterpret_u8_mf8_x3_untied:
+**	mov	(z18|z19|z20)\.d, (z23|z24|z25)\.d
+**	mov	(z18|z19|z20)\.d, (z23|z24|z25)\.d
+**	mov	(z18|z19|z20)\.d, (z23|z24|z25)\.d
+**	ret
+*/
+TEST_DUAL_XN (reinterpret_u8_mf8_x3_untied, svuint8x3_t, svmfloat8x3_t, z18,
+	      svreinterpret_u8_mf8_x3 (z23),
+	      svreinterpret_u8 (z23))
+
 /*
 ** reinterpret_u8_f32_x2_untied:
 ** (
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/rev_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/rev_mf8.c
new file mode 100644
index 00000000000..f0c6532f153
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/rev_mf8.c
@@ -0,0 +1,21 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** rev_mf8_tied1:
+**	rev	z0\.b, z0\.b
+**	ret
+*/
+TEST_UNIFORM_Z (rev_mf8_tied1, svmfloat8_t,
+		z0 = svrev_mf8 (z0),
+		z0 = svrev (z0))
+
+/*
+** rev_mf8_untied:
+**	rev	z0\.b, z1\.b
+**	ret
+*/
+TEST_UNIFORM_Z (rev_mf8_untied, svmfloat8_t,
+		z0 = svrev_mf8 (z1),
+		z0 = svrev (z1))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/sel_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/sel_mf8.c
new file mode 100644
index 00000000000..8a76ce864b7
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/sel_mf8.c
@@ -0,0 +1,30 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** sel_mf8_tied1:
+**	sel	z0\.b, p0, z0\.b, z1\.b
+**	ret
+*/
+TEST_UNIFORM_Z (sel_mf8_tied1, svmfloat8_t,
+		z0 = svsel_mf8 (p0, z0, z1),
+		z0 = svsel (p0, z0, z1))
+
+/*
+** sel_mf8_tied2:
+**	sel	z0\.b, p0, z1\.b, z0\.b
+**	ret
+*/
+TEST_UNIFORM_Z (sel_mf8_tied2, svmfloat8_t,
+		z0 = svsel_mf8 (p0, z1, z0),
+		z0 = svsel (p0, z1, z0))
+
+/*
+** sel_mf8_untied:
+**	sel	z0\.b, p0, z1\.b, z2\.b
+**	ret
+*/
+TEST_UNIFORM_Z (sel_mf8_untied, svmfloat8_t,
+		z0 = svsel_mf8 (p0, z1, z2),
+		z0 = svsel (p0, z1, z2))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/set2_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/set2_mf8.c
new file mode 100644
index 00000000000..7f190d0b4cd
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/set2_mf8.c
@@ -0,0 +1,41 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** set2_mf8_z24_0:
+**	mov	z25\.d, z5\.d
+**	mov	z24\.d, z0\.d
+**	ret
+*/
+TEST_SET (set2_mf8_z24_0, svmfloat8x2_t, svmfloat8_t,
+	  z24 = svset2_mf8 (z4, 0, z0),
+	  z24 = svset2 (z4, 0, z0))
+
+/*
+** set2_mf8_z24_1:
+**	mov	z24\.d, z4\.d
+**	mov	z25\.d, z0\.d
+**	ret
+*/
+TEST_SET (set2_mf8_z24_1, svmfloat8x2_t, svmfloat8_t,
+	  z24 = svset2_mf8 (z4, 1, z0),
+	  z24 = svset2 (z4, 1, z0))
+
+/*
+** set2_mf8_z4_0:
+**	mov	z4\.d, z0\.d
+**	ret
+*/
+TEST_SET (set2_mf8_z4_0, svmfloat8x2_t, svmfloat8_t,
+	  z4 = svset2_mf8 (z4, 0, z0),
+	  z4 = svset2 (z4, 0, z0))
+
+/*
+** set2_mf8_z4_1:
+**	mov	z5\.d, z0\.d
+**	ret
+*/
+TEST_SET (set2_mf8_z4_1, svmfloat8x2_t, svmfloat8_t,
+	  z4 = svset2_mf8 (z4, 1, z0),
+	  z4 = svset2 (z4, 1, z0))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/set3_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/set3_mf8.c
new file mode 100644
index 00000000000..19247616349
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/set3_mf8.c
@@ -0,0 +1,63 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** set3_mf8_z24_0:
+**	mov	z25\.d, z5\.d
+**	mov	z26\.d, z6\.d
+**	mov	z24\.d, z0\.d
+**	ret
+*/
+TEST_SET (set3_mf8_z24_0, svmfloat8x3_t, svmfloat8_t,
+	  z24 = svset3_mf8 (z4, 0, z0),
+	  z24 = svset3 (z4, 0, z0))
+
+/*
+** set3_mf8_z24_1:
+**	mov	z24\.d, z4\.d
+**	mov	z26\.d, z6\.d
+**	mov	z25\.d, z0\.d
+**	ret
+*/
+TEST_SET (set3_mf8_z24_1, svmfloat8x3_t, svmfloat8_t,
+	  z24 = svset3_mf8 (z4, 1, z0),
+	  z24 = svset3 (z4, 1, z0))
+
+/*
+** set3_mf8_z24_2:
+**	mov	z24\.d, z4\.d
+**	mov	z25\.d, z5\.d
+**	mov	z26\.d, z0\.d
+**	ret
+*/
+TEST_SET (set3_mf8_z24_2, svmfloat8x3_t, svmfloat8_t,
+	  z24 = svset3_mf8 (z4, 2, z0),
+	  z24 = svset3 (z4, 2, z0))
+
+/*
+** set3_mf8_z4_0:
+**	mov	z4\.d, z0\.d
+**	ret
+*/
+TEST_SET (set3_mf8_z4_0, svmfloat8x3_t, svmfloat8_t,
+	  z4 = svset3_mf8 (z4, 0, z0),
+	  z4 = svset3 (z4, 0, z0))
+
+/*
+** set3_mf8_z4_1:
+**	mov	z5\.d, z0\.d
+**	ret
+*/
+TEST_SET (set3_mf8_z4_1, svmfloat8x3_t, svmfloat8_t,
+	  z4 = svset3_mf8 (z4, 1, z0),
+	  z4 = svset3 (z4, 1, z0))
+
+/*
+** set3_mf8_z4_2:
+**	mov	z6\.d, z0\.d
+**	ret
+*/
+TEST_SET (set3_mf8_z4_2, svmfloat8x3_t, svmfloat8_t,
+	  z4 = svset3_mf8 (z4, 2, z0),
+	  z4 = svset3 (z4, 2, z0))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/set4_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/set4_mf8.c
new file mode 100644
index 00000000000..faf0ceb3dd7
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/set4_mf8.c
@@ -0,0 +1,87 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** set4_mf8_z24_0:
+**	mov	z25\.d, z5\.d
+**	mov	z26\.d, z6\.d
+**	mov	z27\.d, z7\.d
+**	mov	z24\.d, z0\.d
+**	ret
+*/
+TEST_SET (set4_mf8_z24_0, svmfloat8x4_t, svmfloat8_t,
+	  z24 = svset4_mf8 (z4, 0, z0),
+	  z24 = svset4 (z4, 0, z0))
+
+/*
+** set4_mf8_z24_1:
+**	mov	z24\.d, z4\.d
+**	mov	z26\.d, z6\.d
+**	mov	z27\.d, z7\.d
+**	mov	z25\.d, z0\.d
+**	ret
+*/
+TEST_SET (set4_mf8_z24_1, svmfloat8x4_t, svmfloat8_t,
+	  z24 = svset4_mf8 (z4, 1, z0),
+	  z24 = svset4 (z4, 1, z0))
+
+/*
+** set4_mf8_z24_2:
+**	mov	z24\.d, z4\.d
+**	mov	z25\.d, z5\.d
+**	mov	z27\.d, z7\.d
+**	mov	z26\.d, z0\.d
+**	ret
+*/
+TEST_SET (set4_mf8_z24_2, svmfloat8x4_t, svmfloat8_t,
+	  z24 = svset4_mf8 (z4, 2, z0),
+	  z24 = svset4 (z4, 2, z0))
+
+/*
+** set4_mf8_z24_3:
+**	mov	z24\.d, z4\.d
+**	mov	z25\.d, z5\.d
+**	mov	z26\.d, z6\.d
+**	mov	z27\.d, z0\.d
+**	ret
+*/
+TEST_SET (set4_mf8_z24_3, svmfloat8x4_t, svmfloat8_t,
+	  z24 = svset4_mf8 (z4, 3, z0),
+	  z24 = svset4 (z4, 3, z0))
+
+/*
+** set4_mf8_z4_0:
+**	mov	z4\.d, z0\.d
+**	ret
+*/
+TEST_SET (set4_mf8_z4_0, svmfloat8x4_t, svmfloat8_t,
+	  z4 = svset4_mf8 (z4, 0, z0),
+	  z4 = svset4 (z4, 0, z0))
+
+/*
+** set4_mf8_z4_1:
+**	mov	z5\.d, z0\.d
+**	ret
+*/
+TEST_SET (set4_mf8_z4_1, svmfloat8x4_t, svmfloat8_t,
+	  z4 = svset4_mf8 (z4, 1, z0),
+	  z4 = svset4 (z4, 1, z0))
+
+/*
+** set4_mf8_z4_2:
+**	mov	z6\.d, z0\.d
+**	ret
+*/
+TEST_SET (set4_mf8_z4_2, svmfloat8x4_t, svmfloat8_t,
+	  z4 = svset4_mf8 (z4, 2, z0),
+	  z4 = svset4 (z4, 2, z0))
+
+/*
+** set4_mf8_z4_3:
+**	mov	z7\.d, z0\.d
+**	ret
+*/
+TEST_SET (set4_mf8_z4_3, svmfloat8x4_t, svmfloat8_t,
+	  z4 = svset4_mf8 (z4, 3, z0),
+	  z4 = svset4 (z4, 3, z0))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/set_neonq_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/set_neonq_mf8.c
new file mode 100644
index 00000000000..1de9ac240cc
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/set_neonq_mf8.c
@@ -0,0 +1,23 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** set_neonq_mf8_z24:
+**	ptrue	(p[0-9]+).b, vl16
+**	sel	z24.b, \1, z0.b, z4.b
+**	ret
+*/
+TEST_SET_NEONQ (set_neonq_mf8_z24, svmfloat8_t, mfloat8x16_t,
+	  z24 = svset_neonq_mf8 (z4, z0),
+	  z24 = svset_neonq (z4, z0))
+
+/*
+** set_neonq_mf8_z4:
+**	ptrue	(p[0-9]+).b, vl16
+**	sel	z4.b, \1, z0.b, z4.b
+**	ret
+*/
+TEST_SET_NEONQ (set_neonq_mf8_z4, svmfloat8_t, mfloat8x16_t,
+	  z4_res = svset_neonq_mf8 (z4, z0),
+	  z4_res = svset_neonq (z4, z0))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/splice_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/splice_mf8.c
new file mode 100644
index 00000000000..5ddeff1d3dd
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/splice_mf8.c
@@ -0,0 +1,33 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** splice_mf8_tied1:
+**	splice	z0\.b, p0, z0\.b, z1\.b
+**	ret
+*/
+TEST_UNIFORM_Z (splice_mf8_tied1, svmfloat8_t,
+		z0 = svsplice_mf8 (p0, z0, z1),
+		z0 = svsplice (p0, z0, z1))
+
+/*
+** splice_mf8_tied2:
+**	mov	(z[0-9]+)\.d, z0\.d
+**	movprfx	z0, z1
+**	splice	z0\.b, p0, z0\.b, \1\.b
+**	ret
+*/
+TEST_UNIFORM_Z (splice_mf8_tied2, svmfloat8_t,
+		z0 = svsplice_mf8 (p0, z1, z0),
+		z0 = svsplice (p0, z1, z0))
+
+/*
+** splice_mf8_untied:
+**	movprfx	z0, z1
+**	splice	z0\.b, p0, z0\.b, z2\.b
+**	ret
+*/
+TEST_UNIFORM_Z (splice_mf8_untied, svmfloat8_t,
+		z0 = svsplice_mf8 (p0, z1, z2),
+		z0 = svsplice (p0, z1, z2))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/st1_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/st1_mf8.c
new file mode 100644
index 00000000000..d4ca82bd08c
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/st1_mf8.c
@@ -0,0 +1,162 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" { target { ! ilp32 } } } } */
+
+#include "test_sve_acle.h"
+
+/*
+** st1_mf8_base:
+**	st1b	z0\.b, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (st1_mf8_base, svmfloat8_t, mfloat8_t,
+	    svst1_mf8 (p0, x0, z0),
+	    svst1 (p0, x0, z0))
+
+/*
+** st1_mf8_index:
+**	st1b	z0\.b, p0, \[x0, x1\]
+**	ret
+*/
+TEST_STORE (st1_mf8_index, svmfloat8_t, mfloat8_t,
+	    svst1_mf8 (p0, x0 + x1, z0),
+	    svst1 (p0, x0 + x1, z0))
+
+/*
+** st1_mf8_1:
+**	st1b	z0\.b, p0, \[x0, #1, mul vl\]
+**	ret
+*/
+TEST_STORE (st1_mf8_1, svmfloat8_t, mfloat8_t,
+	    svst1_mf8 (p0, x0 + svcntb (), z0),
+	    svst1 (p0, x0 + svcntb (), z0))
+
+/*
+** st1_mf8_7:
+**	st1b	z0\.b, p0, \[x0, #7, mul vl\]
+**	ret
+*/
+TEST_STORE (st1_mf8_7, svmfloat8_t, mfloat8_t,
+	    svst1_mf8 (p0, x0 + svcntb () * 7, z0),
+	    svst1 (p0, x0 + svcntb () * 7, z0))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** st1_mf8_8:
+**	incb	x0, all, mul #8
+**	st1b	z0\.b, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (st1_mf8_8, svmfloat8_t, mfloat8_t,
+	    svst1_mf8 (p0, x0 + svcntb () * 8, z0),
+	    svst1 (p0, x0 + svcntb () * 8, z0))
+
+/*
+** st1_mf8_m1:
+**	st1b	z0\.b, p0, \[x0, #-1, mul vl\]
+**	ret
+*/
+TEST_STORE (st1_mf8_m1, svmfloat8_t, mfloat8_t,
+	    svst1_mf8 (p0, x0 - svcntb (), z0),
+	    svst1 (p0, x0 - svcntb (), z0))
+
+/*
+** st1_mf8_m8:
+**	st1b	z0\.b, p0, \[x0, #-8, mul vl\]
+**	ret
+*/
+TEST_STORE (st1_mf8_m8, svmfloat8_t, mfloat8_t,
+	    svst1_mf8 (p0, x0 - svcntb () * 8, z0),
+	    svst1 (p0, x0 - svcntb () * 8, z0))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** st1_mf8_m9:
+**	decb	x0, all, mul #9
+**	st1b	z0\.b, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (st1_mf8_m9, svmfloat8_t, mfloat8_t,
+	    svst1_mf8 (p0, x0 - svcntb () * 9, z0),
+	    svst1 (p0, x0 - svcntb () * 9, z0))
+
+/*
+** st1_vnum_mf8_0:
+**	st1b	z0\.b, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (st1_vnum_mf8_0, svmfloat8_t, mfloat8_t,
+	    svst1_vnum_mf8 (p0, x0, 0, z0),
+	    svst1_vnum (p0, x0, 0, z0))
+
+/*
+** st1_vnum_mf8_1:
+**	st1b	z0\.b, p0, \[x0, #1, mul vl\]
+**	ret
+*/
+TEST_STORE (st1_vnum_mf8_1, svmfloat8_t, mfloat8_t,
+	    svst1_vnum_mf8 (p0, x0, 1, z0),
+	    svst1_vnum (p0, x0, 1, z0))
+
+/*
+** st1_vnum_mf8_7:
+**	st1b	z0\.b, p0, \[x0, #7, mul vl\]
+**	ret
+*/
+TEST_STORE (st1_vnum_mf8_7, svmfloat8_t, mfloat8_t,
+	    svst1_vnum_mf8 (p0, x0, 7, z0),
+	    svst1_vnum (p0, x0, 7, z0))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** st1_vnum_mf8_8:
+**	incb	x0, all, mul #8
+**	st1b	z0\.b, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (st1_vnum_mf8_8, svmfloat8_t, mfloat8_t,
+	    svst1_vnum_mf8 (p0, x0, 8, z0),
+	    svst1_vnum (p0, x0, 8, z0))
+
+/*
+** st1_vnum_mf8_m1:
+**	st1b	z0\.b, p0, \[x0, #-1, mul vl\]
+**	ret
+*/
+TEST_STORE (st1_vnum_mf8_m1, svmfloat8_t, mfloat8_t,
+	    svst1_vnum_mf8 (p0, x0, -1, z0),
+	    svst1_vnum (p0, x0, -1, z0))
+
+/*
+** st1_vnum_mf8_m8:
+**	st1b	z0\.b, p0, \[x0, #-8, mul vl\]
+**	ret
+*/
+TEST_STORE (st1_vnum_mf8_m8, svmfloat8_t, mfloat8_t,
+	    svst1_vnum_mf8 (p0, x0, -8, z0),
+	    svst1_vnum (p0, x0, -8, z0))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** st1_vnum_mf8_m9:
+**	decb	x0, all, mul #9
+**	st1b	z0\.b, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (st1_vnum_mf8_m9, svmfloat8_t, mfloat8_t,
+	    svst1_vnum_mf8 (p0, x0, -9, z0),
+	    svst1_vnum (p0, x0, -9, z0))
+
+/*
+** st1_vnum_mf8_x1:
+**	cntb	(x[0-9]+)
+** (
+**	madd	(x[0-9]+), (?:x1, \1|\1, x1), x0
+**	st1b	z0\.b, p0, \[\2\]
+** |
+**	mul	(x[0-9]+), (?:x1, \1|\1, x1)
+**	st1b	z0\.b, p0, \[x0, \3\]
+** )
+**	ret
+*/
+TEST_STORE (st1_vnum_mf8_x1, svmfloat8_t, mfloat8_t,
+	    svst1_vnum_mf8 (p0, x0, x1, z0),
+	    svst1_vnum (p0, x0, x1, z0))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/st2_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/st2_mf8.c
new file mode 100644
index 00000000000..7473f110172
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/st2_mf8.c
@@ -0,0 +1,204 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" { target { ! ilp32 } } } } */
+
+#include "test_sve_acle.h"
+
+/*
+** st2_mf8_base:
+**	st2b	{z0\.b(?: - |, )z1\.b}, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (st2_mf8_base, svmfloat8x2_t, mfloat8_t,
+	    svst2_mf8 (p0, x0, z0),
+	    svst2 (p0, x0, z0))
+
+/*
+** st2_mf8_index:
+**	st2b	{z0\.b(?: - |, )z1\.b}, p0, \[x0, x1\]
+**	ret
+*/
+TEST_STORE (st2_mf8_index, svmfloat8x2_t, mfloat8_t,
+	    svst2_mf8 (p0, x0 + x1, z0),
+	    svst2 (p0, x0 + x1, z0))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** st2_mf8_1:
+**	incb	x0
+**	st2b	{z0\.b(?: - |, )z1\.b}, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (st2_mf8_1, svmfloat8x2_t, mfloat8_t,
+	    svst2_mf8 (p0, x0 + svcntb (), z0),
+	    svst2 (p0, x0 + svcntb (), z0))
+
+/*
+** st2_mf8_2:
+**	st2b	{z0\.b(?: - |, )z1\.b}, p0, \[x0, #2, mul vl\]
+**	ret
+*/
+TEST_STORE (st2_mf8_2, svmfloat8x2_t, mfloat8_t,
+	    svst2_mf8 (p0, x0 + svcntb () * 2, z0),
+	    svst2 (p0, x0 + svcntb () * 2, z0))
+
+/*
+** st2_mf8_14:
+**	st2b	{z0\.b(?: - |, )z1\.b}, p0, \[x0, #14, mul vl\]
+**	ret
+*/
+TEST_STORE (st2_mf8_14, svmfloat8x2_t, mfloat8_t,
+	    svst2_mf8 (p0, x0 + svcntb () * 14, z0),
+	    svst2 (p0, x0 + svcntb () * 14, z0))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** st2_mf8_16:
+**	incb	x0, all, mul #16
+**	st2b	{z0\.b(?: - |, )z1\.b}, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (st2_mf8_16, svmfloat8x2_t, mfloat8_t,
+	    svst2_mf8 (p0, x0 + svcntb () * 16, z0),
+	    svst2 (p0, x0 + svcntb () * 16, z0))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** st2_mf8_m1:
+**	decb	x0
+**	st2b	{z0\.b(?: - |, )z1\.b}, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (st2_mf8_m1, svmfloat8x2_t, mfloat8_t,
+	    svst2_mf8 (p0, x0 - svcntb (), z0),
+	    svst2 (p0, x0 - svcntb (), z0))
+
+/*
+** st2_mf8_m2:
+**	st2b	{z0\.b(?: - |, )z1\.b}, p0, \[x0, #-2, mul vl\]
+**	ret
+*/
+TEST_STORE (st2_mf8_m2, svmfloat8x2_t, mfloat8_t,
+	    svst2_mf8 (p0, x0 - svcntb () * 2, z0),
+	    svst2 (p0, x0 - svcntb () * 2, z0))
+
+/*
+** st2_mf8_m16:
+**	st2b	{z0\.b(?: - |, )z1\.b}, p0, \[x0, #-16, mul vl\]
+**	ret
+*/
+TEST_STORE (st2_mf8_m16, svmfloat8x2_t, mfloat8_t,
+	    svst2_mf8 (p0, x0 - svcntb () * 16, z0),
+	    svst2 (p0, x0 - svcntb () * 16, z0))
+
+/*
+** st2_mf8_m18:
+**	addvl	(x[0-9]+), x0, #-18
+**	st2b	{z0\.b(?: - |, )z1\.b}, p0, \[\1\]
+**	ret
+*/
+TEST_STORE (st2_mf8_m18, svmfloat8x2_t, mfloat8_t,
+	    svst2_mf8 (p0, x0 - svcntb () * 18, z0),
+	    svst2 (p0, x0 - svcntb () * 18, z0))
+
+/*
+** st2_vnum_mf8_0:
+**	st2b	{z0\.b(?: - |, )z1\.b}, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (st2_vnum_mf8_0, svmfloat8x2_t, mfloat8_t,
+	    svst2_vnum_mf8 (p0, x0, 0, z0),
+	    svst2_vnum (p0, x0, 0, z0))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** st2_vnum_mf8_1:
+**	incb	x0
+**	st2b	{z0\.b(?: - |, )z1\.b}, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (st2_vnum_mf8_1, svmfloat8x2_t, mfloat8_t,
+	    svst2_vnum_mf8 (p0, x0, 1, z0),
+	    svst2_vnum (p0, x0, 1, z0))
+
+/*
+** st2_vnum_mf8_2:
+**	st2b	{z0\.b(?: - |, )z1\.b}, p0, \[x0, #2, mul vl\]
+**	ret
+*/
+TEST_STORE (st2_vnum_mf8_2, svmfloat8x2_t, mfloat8_t,
+	    svst2_vnum_mf8 (p0, x0, 2, z0),
+	    svst2_vnum (p0, x0, 2, z0))
+
+/*
+** st2_vnum_mf8_14:
+**	st2b	{z0\.b(?: - |, )z1\.b}, p0, \[x0, #14, mul vl\]
+**	ret
+*/
+TEST_STORE (st2_vnum_mf8_14, svmfloat8x2_t, mfloat8_t,
+	    svst2_vnum_mf8 (p0, x0, 14, z0),
+	    svst2_vnum (p0, x0, 14, z0))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** st2_vnum_mf8_16:
+**	incb	x0, all, mul #16
+**	st2b	{z0\.b(?: - |, )z1\.b}, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (st2_vnum_mf8_16, svmfloat8x2_t, mfloat8_t,
+	    svst2_vnum_mf8 (p0, x0, 16, z0),
+	    svst2_vnum (p0, x0, 16, z0))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** st2_vnum_mf8_m1:
+**	decb	x0
+**	st2b	{z0\.b(?: - |, )z1\.b}, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (st2_vnum_mf8_m1, svmfloat8x2_t, mfloat8_t,
+	    svst2_vnum_mf8 (p0, x0, -1, z0),
+	    svst2_vnum (p0, x0, -1, z0))
+
+/*
+** st2_vnum_mf8_m2:
+**	st2b	{z0\.b(?: - |, )z1\.b}, p0, \[x0, #-2, mul vl\]
+**	ret
+*/
+TEST_STORE (st2_vnum_mf8_m2, svmfloat8x2_t, mfloat8_t,
+	    svst2_vnum_mf8 (p0, x0, -2, z0),
+	    svst2_vnum (p0, x0, -2, z0))
+
+/*
+** st2_vnum_mf8_m16:
+**	st2b	{z0\.b(?: - |, )z1\.b}, p0, \[x0, #-16, mul vl\]
+**	ret
+*/
+TEST_STORE (st2_vnum_mf8_m16, svmfloat8x2_t, mfloat8_t,
+	    svst2_vnum_mf8 (p0, x0, -16, z0),
+	    svst2_vnum (p0, x0, -16, z0))
+
+/*
+** st2_vnum_mf8_m18:
+**	addvl	(x[0-9]+), x0, #-18
+**	st2b	{z0\.b(?: - |, )z1\.b}, p0, \[\1\]
+**	ret
+*/
+TEST_STORE (st2_vnum_mf8_m18, svmfloat8x2_t, mfloat8_t,
+	    svst2_vnum_mf8 (p0, x0, -18, z0),
+	    svst2_vnum (p0, x0, -18, z0))
+
+/*
+** st2_vnum_mf8_x1:
+**	cntb	(x[0-9]+)
+** (
+**	madd	(x[0-9]+), (?:x1, \1|\1, x1), x0
+**	st2b	{z0\.b(?: - |, )z1\.b}, p0, \[\2\]
+** |
+**	mul	(x[0-9]+), (?:x1, \1|\1, x1)
+**	st2b	{z0\.b(?: - |, )z1\.b}, p0, \[x0, \3\]
+** )
+**	ret
+*/
+TEST_STORE (st2_vnum_mf8_x1, svmfloat8x2_t, mfloat8_t,
+	    svst2_vnum_mf8 (p0, x0, x1, z0),
+	    svst2_vnum (p0, x0, x1, z0))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/st3_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/st3_mf8.c
new file mode 100644
index 00000000000..e23e7e979de
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/st3_mf8.c
@@ -0,0 +1,246 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" { target { ! ilp32 } } } } */
+
+#include "test_sve_acle.h"
+
+/*
+** st3_mf8_base:
+**	st3b	{z0\.b - z2\.b}, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (st3_mf8_base, svmfloat8x3_t, mfloat8_t,
+	    svst3_mf8 (p0, x0, z0),
+	    svst3 (p0, x0, z0))
+
+/*
+** st3_mf8_index:
+**	st3b	{z0\.b - z2\.b}, p0, \[x0, x1\]
+**	ret
+*/
+TEST_STORE (st3_mf8_index, svmfloat8x3_t, mfloat8_t,
+	    svst3_mf8 (p0, x0 + x1, z0),
+	    svst3 (p0, x0 + x1, z0))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** st3_mf8_1:
+**	incb	x0
+**	st3b	{z0\.b - z2\.b}, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (st3_mf8_1, svmfloat8x3_t, mfloat8_t,
+	    svst3_mf8 (p0, x0 + svcntb (), z0),
+	    svst3 (p0, x0 + svcntb (), z0))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** st3_mf8_2:
+**	incb	x0, all, mul #2
+**	st3b	{z0\.b - z2\.b}, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (st3_mf8_2, svmfloat8x3_t, mfloat8_t,
+	    svst3_mf8 (p0, x0 + svcntb () * 2, z0),
+	    svst3 (p0, x0 + svcntb () * 2, z0))
+
+/*
+** st3_mf8_3:
+**	st3b	{z0\.b - z2\.b}, p0, \[x0, #3, mul vl\]
+**	ret
+*/
+TEST_STORE (st3_mf8_3, svmfloat8x3_t, mfloat8_t,
+	    svst3_mf8 (p0, x0 + svcntb () * 3, z0),
+	    svst3 (p0, x0 + svcntb () * 3, z0))
+
+/*
+** st3_mf8_21:
+**	st3b	{z0\.b - z2\.b}, p0, \[x0, #21, mul vl\]
+**	ret
+*/
+TEST_STORE (st3_mf8_21, svmfloat8x3_t, mfloat8_t,
+	    svst3_mf8 (p0, x0 + svcntb () * 21, z0),
+	    svst3 (p0, x0 + svcntb () * 21, z0))
+
+/*
+** st3_mf8_24:
+**	addvl	(x[0-9]+), x0, #24
+**	st3b	{z0\.b - z2\.b}, p0, \[\1\]
+**	ret
+*/
+TEST_STORE (st3_mf8_24, svmfloat8x3_t, mfloat8_t,
+	    svst3_mf8 (p0, x0 + svcntb () * 24, z0),
+	    svst3 (p0, x0 + svcntb () * 24, z0))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** st3_mf8_m1:
+**	decb	x0
+**	st3b	{z0\.b - z2\.b}, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (st3_mf8_m1, svmfloat8x3_t, mfloat8_t,
+	    svst3_mf8 (p0, x0 - svcntb (), z0),
+	    svst3 (p0, x0 - svcntb (), z0))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** st3_mf8_m2:
+**	decb	x0, all, mul #2
+**	st3b	{z0\.b - z2\.b}, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (st3_mf8_m2, svmfloat8x3_t, mfloat8_t,
+	    svst3_mf8 (p0, x0 - svcntb () * 2, z0),
+	    svst3 (p0, x0 - svcntb () * 2, z0))
+
+/*
+** st3_mf8_m3:
+**	st3b	{z0\.b - z2\.b}, p0, \[x0, #-3, mul vl\]
+**	ret
+*/
+TEST_STORE (st3_mf8_m3, svmfloat8x3_t, mfloat8_t,
+	    svst3_mf8 (p0, x0 - svcntb () * 3, z0),
+	    svst3 (p0, x0 - svcntb () * 3, z0))
+
+/*
+** st3_mf8_m24:
+**	st3b	{z0\.b - z2\.b}, p0, \[x0, #-24, mul vl\]
+**	ret
+*/
+TEST_STORE (st3_mf8_m24, svmfloat8x3_t, mfloat8_t,
+	    svst3_mf8 (p0, x0 - svcntb () * 24, z0),
+	    svst3 (p0, x0 - svcntb () * 24, z0))
+
+/*
+** st3_mf8_m27:
+**	addvl	(x[0-9]+), x0, #-27
+**	st3b	{z0\.b - z2\.b}, p0, \[\1\]
+**	ret
+*/
+TEST_STORE (st3_mf8_m27, svmfloat8x3_t, mfloat8_t,
+	    svst3_mf8 (p0, x0 - svcntb () * 27, z0),
+	    svst3 (p0, x0 - svcntb () * 27, z0))
+
+/*
+** st3_vnum_mf8_0:
+**	st3b	{z0\.b - z2\.b}, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (st3_vnum_mf8_0, svmfloat8x3_t, mfloat8_t,
+	    svst3_vnum_mf8 (p0, x0, 0, z0),
+	    svst3_vnum (p0, x0, 0, z0))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** st3_vnum_mf8_1:
+**	incb	x0
+**	st3b	{z0\.b - z2\.b}, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (st3_vnum_mf8_1, svmfloat8x3_t, mfloat8_t,
+	    svst3_vnum_mf8 (p0, x0, 1, z0),
+	    svst3_vnum (p0, x0, 1, z0))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** st3_vnum_mf8_2:
+**	incb	x0, all, mul #2
+**	st3b	{z0\.b - z2\.b}, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (st3_vnum_mf8_2, svmfloat8x3_t, mfloat8_t,
+	    svst3_vnum_mf8 (p0, x0, 2, z0),
+	    svst3_vnum (p0, x0, 2, z0))
+
+/*
+** st3_vnum_mf8_3:
+**	st3b	{z0\.b - z2\.b}, p0, \[x0, #3, mul vl\]
+**	ret
+*/
+TEST_STORE (st3_vnum_mf8_3, svmfloat8x3_t, mfloat8_t,
+	    svst3_vnum_mf8 (p0, x0, 3, z0),
+	    svst3_vnum (p0, x0, 3, z0))
+
+/*
+** st3_vnum_mf8_21:
+**	st3b	{z0\.b - z2\.b}, p0, \[x0, #21, mul vl\]
+**	ret
+*/
+TEST_STORE (st3_vnum_mf8_21, svmfloat8x3_t, mfloat8_t,
+	    svst3_vnum_mf8 (p0, x0, 21, z0),
+	    svst3_vnum (p0, x0, 21, z0))
+
+/*
+** st3_vnum_mf8_24:
+**	addvl	(x[0-9]+), x0, #24
+**	st3b	{z0\.b - z2\.b}, p0, \[\1\]
+**	ret
+*/
+TEST_STORE (st3_vnum_mf8_24, svmfloat8x3_t, mfloat8_t,
+	    svst3_vnum_mf8 (p0, x0, 24, z0),
+	    svst3_vnum (p0, x0, 24, z0))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** st3_vnum_mf8_m1:
+**	decb	x0
+**	st3b	{z0\.b - z2\.b}, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (st3_vnum_mf8_m1, svmfloat8x3_t, mfloat8_t,
+	    svst3_vnum_mf8 (p0, x0, -1, z0),
+	    svst3_vnum (p0, x0, -1, z0))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** st3_vnum_mf8_m2:
+**	decb	x0, all, mul #2
+**	st3b	{z0\.b - z2\.b}, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (st3_vnum_mf8_m2, svmfloat8x3_t, mfloat8_t,
+	    svst3_vnum_mf8 (p0, x0, -2, z0),
+	    svst3_vnum (p0, x0, -2, z0))
+
+/*
+** st3_vnum_mf8_m3:
+**	st3b	{z0\.b - z2\.b}, p0, \[x0, #-3, mul vl\]
+**	ret
+*/
+TEST_STORE (st3_vnum_mf8_m3, svmfloat8x3_t, mfloat8_t,
+	    svst3_vnum_mf8 (p0, x0, -3, z0),
+	    svst3_vnum (p0, x0, -3, z0))
+
+/*
+** st3_vnum_mf8_m24:
+**	st3b	{z0\.b - z2\.b}, p0, \[x0, #-24, mul vl\]
+**	ret
+*/
+TEST_STORE (st3_vnum_mf8_m24, svmfloat8x3_t, mfloat8_t,
+	    svst3_vnum_mf8 (p0, x0, -24, z0),
+	    svst3_vnum (p0, x0, -24, z0))
+
+/*
+** st3_vnum_mf8_m27:
+**	addvl	(x[0-9]+), x0, #-27
+**	st3b	{z0\.b - z2\.b}, p0, \[\1\]
+**	ret
+*/
+TEST_STORE (st3_vnum_mf8_m27, svmfloat8x3_t, mfloat8_t,
+	    svst3_vnum_mf8 (p0, x0, -27, z0),
+	    svst3_vnum (p0, x0, -27, z0))
+
+/*
+** st3_vnum_mf8_x1:
+**	cntb	(x[0-9]+)
+** (
+**	madd	(x[0-9]+), (?:x1, \1|\1, x1), x0
+**	st3b	{z0\.b - z2\.b}, p0, \[\2\]
+** |
+**	mul	(x[0-9]+), (?:x1, \1|\1, x1)
+**	st3b	{z0\.b - z2\.b}, p0, \[x0, \3\]
+** )
+**	ret
+*/
+TEST_STORE (st3_vnum_mf8_x1, svmfloat8x3_t, mfloat8_t,
+	    svst3_vnum_mf8 (p0, x0, x1, z0),
+	    svst3_vnum (p0, x0, x1, z0))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/st4_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/st4_mf8.c
new file mode 100644
index 00000000000..5c9526a816d
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/st4_mf8.c
@@ -0,0 +1,290 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" { target { ! ilp32 } } } } */
+
+#include "test_sve_acle.h"
+
+/*
+** st4_mf8_base:
+**	st4b	{z0\.b - z3\.b}, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (st4_mf8_base, svmfloat8x4_t, mfloat8_t,
+	    svst4_mf8 (p0, x0, z0),
+	    svst4 (p0, x0, z0))
+
+/*
+** st4_mf8_index:
+**	st4b	{z0\.b - z3\.b}, p0, \[x0, x1\]
+**	ret
+*/
+TEST_STORE (st4_mf8_index, svmfloat8x4_t, mfloat8_t,
+	    svst4_mf8 (p0, x0 + x1, z0),
+	    svst4 (p0, x0 + x1, z0))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** st4_mf8_1:
+**	incb	x0
+**	st4b	{z0\.b - z3\.b}, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (st4_mf8_1, svmfloat8x4_t, mfloat8_t,
+	    svst4_mf8 (p0, x0 + svcntb (), z0),
+	    svst4 (p0, x0 + svcntb (), z0))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** st4_mf8_2:
+**	incb	x0, all, mul #2
+**	st4b	{z0\.b - z3\.b}, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (st4_mf8_2, svmfloat8x4_t, mfloat8_t,
+	    svst4_mf8 (p0, x0 + svcntb () * 2, z0),
+	    svst4 (p0, x0 + svcntb () * 2, z0))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** st4_mf8_3:
+**	incb	x0, all, mul #3
+**	st4b	{z0\.b - z3\.b}, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (st4_mf8_3, svmfloat8x4_t, mfloat8_t,
+	    svst4_mf8 (p0, x0 + svcntb () * 3, z0),
+	    svst4 (p0, x0 + svcntb () * 3, z0))
+
+/*
+** st4_mf8_4:
+**	st4b	{z0\.b - z3\.b}, p0, \[x0, #4, mul vl\]
+**	ret
+*/
+TEST_STORE (st4_mf8_4, svmfloat8x4_t, mfloat8_t,
+	    svst4_mf8 (p0, x0 + svcntb () * 4, z0),
+	    svst4 (p0, x0 + svcntb () * 4, z0))
+
+/*
+** st4_mf8_28:
+**	st4b	{z0\.b - z3\.b}, p0, \[x0, #28, mul vl\]
+**	ret
+*/
+TEST_STORE (st4_mf8_28, svmfloat8x4_t, mfloat8_t,
+	    svst4_mf8 (p0, x0 + svcntb () * 28, z0),
+	    svst4 (p0, x0 + svcntb () * 28, z0))
+
+/*
+** st4_mf8_32:
+**	[^{]*
+**	st4b	{z0\.b - z3\.b}, p0, \[x[0-9]+, x[0-9]+\]
+**	ret
+*/
+TEST_STORE (st4_mf8_32, svmfloat8x4_t, mfloat8_t,
+	    svst4_mf8 (p0, x0 + svcntb () * 32, z0),
+	    svst4 (p0, x0 + svcntb () * 32, z0))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** st4_mf8_m1:
+**	decb	x0
+**	st4b	{z0\.b - z3\.b}, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (st4_mf8_m1, svmfloat8x4_t, mfloat8_t,
+	    svst4_mf8 (p0, x0 - svcntb (), z0),
+	    svst4 (p0, x0 - svcntb (), z0))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** st4_mf8_m2:
+**	decb	x0, all, mul #2
+**	st4b	{z0\.b - z3\.b}, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (st4_mf8_m2, svmfloat8x4_t, mfloat8_t,
+	    svst4_mf8 (p0, x0 - svcntb () * 2, z0),
+	    svst4 (p0, x0 - svcntb () * 2, z0))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** st4_mf8_m3:
+**	decb	x0, all, mul #3
+**	st4b	{z0\.b - z3\.b}, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (st4_mf8_m3, svmfloat8x4_t, mfloat8_t,
+	    svst4_mf8 (p0, x0 - svcntb () * 3, z0),
+	    svst4 (p0, x0 - svcntb () * 3, z0))
+
+/*
+** st4_mf8_m4:
+**	st4b	{z0\.b - z3\.b}, p0, \[x0, #-4, mul vl\]
+**	ret
+*/
+TEST_STORE (st4_mf8_m4, svmfloat8x4_t, mfloat8_t,
+	    svst4_mf8 (p0, x0 - svcntb () * 4, z0),
+	    svst4 (p0, x0 - svcntb () * 4, z0))
+
+/*
+** st4_mf8_m32:
+**	st4b	{z0\.b - z3\.b}, p0, \[x0, #-32, mul vl\]
+**	ret
+*/
+TEST_STORE (st4_mf8_m32, svmfloat8x4_t, mfloat8_t,
+	    svst4_mf8 (p0, x0 - svcntb () * 32, z0),
+	    svst4 (p0, x0 - svcntb () * 32, z0))
+
+/*
+** st4_mf8_m36:
+**	[^{]*
+**	st4b	{z0\.b - z3\.b}, p0, \[x[0-9]+, x[0-9]+\]
+**	ret
+*/
+TEST_STORE (st4_mf8_m36, svmfloat8x4_t, mfloat8_t,
+	    svst4_mf8 (p0, x0 - svcntb () * 36, z0),
+	    svst4 (p0, x0 - svcntb () * 36, z0))
+
+/*
+** st4_vnum_mf8_0:
+**	st4b	{z0\.b - z3\.b}, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (st4_vnum_mf8_0, svmfloat8x4_t, mfloat8_t,
+	    svst4_vnum_mf8 (p0, x0, 0, z0),
+	    svst4_vnum (p0, x0, 0, z0))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** st4_vnum_mf8_1:
+**	incb	x0
+**	st4b	{z0\.b - z3\.b}, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (st4_vnum_mf8_1, svmfloat8x4_t, mfloat8_t,
+	    svst4_vnum_mf8 (p0, x0, 1, z0),
+	    svst4_vnum (p0, x0, 1, z0))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** st4_vnum_mf8_2:
+**	incb	x0, all, mul #2
+**	st4b	{z0\.b - z3\.b}, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (st4_vnum_mf8_2, svmfloat8x4_t, mfloat8_t,
+	    svst4_vnum_mf8 (p0, x0, 2, z0),
+	    svst4_vnum (p0, x0, 2, z0))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** st4_vnum_mf8_3:
+**	incb	x0, all, mul #3
+**	st4b	{z0\.b - z3\.b}, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (st4_vnum_mf8_3, svmfloat8x4_t, mfloat8_t,
+	    svst4_vnum_mf8 (p0, x0, 3, z0),
+	    svst4_vnum (p0, x0, 3, z0))
+
+/*
+** st4_vnum_mf8_4:
+**	st4b	{z0\.b - z3\.b}, p0, \[x0, #4, mul vl\]
+**	ret
+*/
+TEST_STORE (st4_vnum_mf8_4, svmfloat8x4_t, mfloat8_t,
+	    svst4_vnum_mf8 (p0, x0, 4, z0),
+	    svst4_vnum (p0, x0, 4, z0))
+
+/*
+** st4_vnum_mf8_28:
+**	st4b	{z0\.b - z3\.b}, p0, \[x0, #28, mul vl\]
+**	ret
+*/
+TEST_STORE (st4_vnum_mf8_28, svmfloat8x4_t, mfloat8_t,
+	    svst4_vnum_mf8 (p0, x0, 28, z0),
+	    svst4_vnum (p0, x0, 28, z0))
+
+/*
+** st4_vnum_mf8_32:
+**	[^{]*
+**	st4b	{z0\.b - z3\.b}, p0, \[x[0-9]+, x[0-9]+\]
+**	ret
+*/
+TEST_STORE (st4_vnum_mf8_32, svmfloat8x4_t, mfloat8_t,
+	    svst4_vnum_mf8 (p0, x0, 32, z0),
+	    svst4_vnum (p0, x0, 32, z0))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** st4_vnum_mf8_m1:
+**	decb	x0
+**	st4b	{z0\.b - z3\.b}, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (st4_vnum_mf8_m1, svmfloat8x4_t, mfloat8_t,
+	    svst4_vnum_mf8 (p0, x0, -1, z0),
+	    svst4_vnum (p0, x0, -1, z0))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** st4_vnum_mf8_m2:
+**	decb	x0, all, mul #2
+**	st4b	{z0\.b - z3\.b}, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (st4_vnum_mf8_m2, svmfloat8x4_t, mfloat8_t,
+	    svst4_vnum_mf8 (p0, x0, -2, z0),
+	    svst4_vnum (p0, x0, -2, z0))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** st4_vnum_mf8_m3:
+**	decb	x0, all, mul #3
+**	st4b	{z0\.b - z3\.b}, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (st4_vnum_mf8_m3, svmfloat8x4_t, mfloat8_t,
+	    svst4_vnum_mf8 (p0, x0, -3, z0),
+	    svst4_vnum (p0, x0, -3, z0))
+
+/*
+** st4_vnum_mf8_m4:
+**	st4b	{z0\.b - z3\.b}, p0, \[x0, #-4, mul vl\]
+**	ret
+*/
+TEST_STORE (st4_vnum_mf8_m4, svmfloat8x4_t, mfloat8_t,
+	    svst4_vnum_mf8 (p0, x0, -4, z0),
+	    svst4_vnum (p0, x0, -4, z0))
+
+/*
+** st4_vnum_mf8_m32:
+**	st4b	{z0\.b - z3\.b}, p0, \[x0, #-32, mul vl\]
+**	ret
+*/
+TEST_STORE (st4_vnum_mf8_m32, svmfloat8x4_t, mfloat8_t,
+	    svst4_vnum_mf8 (p0, x0, -32, z0),
+	    svst4_vnum (p0, x0, -32, z0))
+
+/*
+** st4_vnum_mf8_m36:
+**	[^{]*
+**	st4b	{z0\.b - z3\.b}, p0, \[x[0-9]+, x[0-9]+\]
+**	ret
+*/
+TEST_STORE (st4_vnum_mf8_m36, svmfloat8x4_t, mfloat8_t,
+	    svst4_vnum_mf8 (p0, x0, -36, z0),
+	    svst4_vnum (p0, x0, -36, z0))
+
+/*
+** st4_vnum_mf8_x1:
+**	cntb	(x[0-9]+)
+** (
+**	madd	(x[0-9]+), (?:x1, \1|\1, x1), x0
+**	st4b	{z0\.b - z3\.b}, p0, \[\2\]
+** |
+**	mul	(x[0-9]+), (?:x1, \1|\1, x1)
+**	st4b	{z0\.b - z3\.b}, p0, \[x0, \3\]
+** )
+**	ret
+*/
+TEST_STORE (st4_vnum_mf8_x1, svmfloat8x4_t, mfloat8_t,
+	    svst4_vnum_mf8 (p0, x0, x1, z0),
+	    svst4_vnum (p0, x0, x1, z0))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/stnt1_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/stnt1_mf8.c
new file mode 100644
index 00000000000..5bcb8dfa4fa
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/stnt1_mf8.c
@@ -0,0 +1,162 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" { target { ! ilp32 } } } } */
+
+#include "test_sve_acle.h"
+
+/*
+** stnt1_mf8_base:
+**	stnt1b	z0\.b, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (stnt1_mf8_base, svmfloat8_t, mfloat8_t,
+	    svstnt1_mf8 (p0, x0, z0),
+	    svstnt1 (p0, x0, z0))
+
+/*
+** stnt1_mf8_index:
+**	stnt1b	z0\.b, p0, \[x0, x1\]
+**	ret
+*/
+TEST_STORE (stnt1_mf8_index, svmfloat8_t, mfloat8_t,
+	    svstnt1_mf8 (p0, x0 + x1, z0),
+	    svstnt1 (p0, x0 + x1, z0))
+
+/*
+** stnt1_mf8_1:
+**	stnt1b	z0\.b, p0, \[x0, #1, mul vl\]
+**	ret
+*/
+TEST_STORE (stnt1_mf8_1, svmfloat8_t, mfloat8_t,
+	    svstnt1_mf8 (p0, x0 + svcntb (), z0),
+	    svstnt1 (p0, x0 + svcntb (), z0))
+
+/*
+** stnt1_mf8_7:
+**	stnt1b	z0\.b, p0, \[x0, #7, mul vl\]
+**	ret
+*/
+TEST_STORE (stnt1_mf8_7, svmfloat8_t, mfloat8_t,
+	    svstnt1_mf8 (p0, x0 + svcntb () * 7, z0),
+	    svstnt1 (p0, x0 + svcntb () * 7, z0))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** stnt1_mf8_8:
+**	incb	x0, all, mul #8
+**	stnt1b	z0\.b, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (stnt1_mf8_8, svmfloat8_t, mfloat8_t,
+	    svstnt1_mf8 (p0, x0 + svcntb () * 8, z0),
+	    svstnt1 (p0, x0 + svcntb () * 8, z0))
+
+/*
+** stnt1_mf8_m1:
+**	stnt1b	z0\.b, p0, \[x0, #-1, mul vl\]
+**	ret
+*/
+TEST_STORE (stnt1_mf8_m1, svmfloat8_t, mfloat8_t,
+	    svstnt1_mf8 (p0, x0 - svcntb (), z0),
+	    svstnt1 (p0, x0 - svcntb (), z0))
+
+/*
+** stnt1_mf8_m8:
+**	stnt1b	z0\.b, p0, \[x0, #-8, mul vl\]
+**	ret
+*/
+TEST_STORE (stnt1_mf8_m8, svmfloat8_t, mfloat8_t,
+	    svstnt1_mf8 (p0, x0 - svcntb () * 8, z0),
+	    svstnt1 (p0, x0 - svcntb () * 8, z0))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** stnt1_mf8_m9:
+**	decb	x0, all, mul #9
+**	stnt1b	z0\.b, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (stnt1_mf8_m9, svmfloat8_t, mfloat8_t,
+	    svstnt1_mf8 (p0, x0 - svcntb () * 9, z0),
+	    svstnt1 (p0, x0 - svcntb () * 9, z0))
+
+/*
+** stnt1_vnum_mf8_0:
+**	stnt1b	z0\.b, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (stnt1_vnum_mf8_0, svmfloat8_t, mfloat8_t,
+	    svstnt1_vnum_mf8 (p0, x0, 0, z0),
+	    svstnt1_vnum (p0, x0, 0, z0))
+
+/*
+** stnt1_vnum_mf8_1:
+**	stnt1b	z0\.b, p0, \[x0, #1, mul vl\]
+**	ret
+*/
+TEST_STORE (stnt1_vnum_mf8_1, svmfloat8_t, mfloat8_t,
+	    svstnt1_vnum_mf8 (p0, x0, 1, z0),
+	    svstnt1_vnum (p0, x0, 1, z0))
+
+/*
+** stnt1_vnum_mf8_7:
+**	stnt1b	z0\.b, p0, \[x0, #7, mul vl\]
+**	ret
+*/
+TEST_STORE (stnt1_vnum_mf8_7, svmfloat8_t, mfloat8_t,
+	    svstnt1_vnum_mf8 (p0, x0, 7, z0),
+	    svstnt1_vnum (p0, x0, 7, z0))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** stnt1_vnum_mf8_8:
+**	incb	x0, all, mul #8
+**	stnt1b	z0\.b, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (stnt1_vnum_mf8_8, svmfloat8_t, mfloat8_t,
+	    svstnt1_vnum_mf8 (p0, x0, 8, z0),
+	    svstnt1_vnum (p0, x0, 8, z0))
+
+/*
+** stnt1_vnum_mf8_m1:
+**	stnt1b	z0\.b, p0, \[x0, #-1, mul vl\]
+**	ret
+*/
+TEST_STORE (stnt1_vnum_mf8_m1, svmfloat8_t, mfloat8_t,
+	    svstnt1_vnum_mf8 (p0, x0, -1, z0),
+	    svstnt1_vnum (p0, x0, -1, z0))
+
+/*
+** stnt1_vnum_mf8_m8:
+**	stnt1b	z0\.b, p0, \[x0, #-8, mul vl\]
+**	ret
+*/
+TEST_STORE (stnt1_vnum_mf8_m8, svmfloat8_t, mfloat8_t,
+	    svstnt1_vnum_mf8 (p0, x0, -8, z0),
+	    svstnt1_vnum (p0, x0, -8, z0))
+
+/* Moving the constant into a register would also be OK.  */
+/*
+** stnt1_vnum_mf8_m9:
+**	decb	x0, all, mul #9
+**	stnt1b	z0\.b, p0, \[x0\]
+**	ret
+*/
+TEST_STORE (stnt1_vnum_mf8_m9, svmfloat8_t, mfloat8_t,
+	    svstnt1_vnum_mf8 (p0, x0, -9, z0),
+	    svstnt1_vnum (p0, x0, -9, z0))
+
+/*
+** stnt1_vnum_mf8_x1:
+**	cntb	(x[0-9]+)
+** (
+**	madd	(x[0-9]+), (?:x1, \1|\1, x1), x0
+**	stnt1b	z0\.b, p0, \[\2\]
+** |
+**	mul	(x[0-9]+), (?:x1, \1|\1, x1)
+**	stnt1b	z0\.b, p0, \[x0, \3\]
+** )
+**	ret
+*/
+TEST_STORE (stnt1_vnum_mf8_x1, svmfloat8_t, mfloat8_t,
+	    svstnt1_vnum_mf8 (p0, x0, x1, z0),
+	    svstnt1_vnum (p0, x0, x1, z0))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/tbl_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/tbl_mf8.c
new file mode 100644
index 00000000000..f729cac2bb0
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/tbl_mf8.c
@@ -0,0 +1,30 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** tbl_mf8_tied1:
+**	tbl	z0\.b, z0\.b, z4\.b
+**	ret
+*/
+TEST_DUAL_Z (tbl_mf8_tied1, svmfloat8_t, svuint8_t,
+	     z0 = svtbl_mf8 (z0, z4),
+	     z0 = svtbl (z0, z4))
+
+/*
+** tbl_mf8_tied2:
+**	tbl	z0\.b, z4\.b, z0\.b
+**	ret
+*/
+TEST_DUAL_Z_REV (tbl_mf8_tied2, svmfloat8_t, svuint8_t,
+		 z0_res = svtbl_mf8 (z4, z0),
+		 z0_res = svtbl (z4, z0))
+
+/*
+** tbl_mf8_untied:
+**	tbl	z0\.b, z1\.b, z4\.b
+**	ret
+*/
+TEST_DUAL_Z (tbl_mf8_untied, svmfloat8_t, svuint8_t,
+	     z0 = svtbl_mf8 (z1, z4),
+	     z0 = svtbl (z1, z4))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/trn1_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/trn1_mf8.c
new file mode 100644
index 00000000000..2676c79bb74
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/trn1_mf8.c
@@ -0,0 +1,30 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** trn1_mf8_tied1:
+**	trn1	z0\.b, z0\.b, z1\.b
+**	ret
+*/
+TEST_UNIFORM_Z (trn1_mf8_tied1, svmfloat8_t,
+		z0 = svtrn1_mf8 (z0, z1),
+		z0 = svtrn1 (z0, z1))
+
+/*
+** trn1_mf8_tied2:
+**	trn1	z0\.b, z1\.b, z0\.b
+**	ret
+*/
+TEST_UNIFORM_Z (trn1_mf8_tied2, svmfloat8_t,
+		z0 = svtrn1_mf8 (z1, z0),
+		z0 = svtrn1 (z1, z0))
+
+/*
+** trn1_mf8_untied:
+**	trn1	z0\.b, z1\.b, z2\.b
+**	ret
+*/
+TEST_UNIFORM_Z (trn1_mf8_untied, svmfloat8_t,
+		z0 = svtrn1_mf8 (z1, z2),
+		z0 = svtrn1 (z1, z2))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/trn1q_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/trn1q_mf8.c
new file mode 100644
index 00000000000..3f5cf5a7e54
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/trn1q_mf8.c
@@ -0,0 +1,33 @@
+/* { dg-require-effective-target aarch64_asm_f64mm_ok } */
+/* { dg-additional-options "-march=armv8.2-a+f64mm" } */
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+/* { dg-skip-if "" { *-*-* } { "-DSTREAMING_COMPATIBLE" } { "" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** trn1q_mf8_tied1:
+**	trn1	z0\.q, z0\.q, z1\.q
+**	ret
+*/
+TEST_UNIFORM_Z (trn1q_mf8_tied1, svmfloat8_t,
+		z0 = svtrn1q_mf8 (z0, z1),
+		z0 = svtrn1q (z0, z1))
+
+/*
+** trn1q_mf8_tied2:
+**	trn1	z0\.q, z1\.q, z0\.q
+**	ret
+*/
+TEST_UNIFORM_Z (trn1q_mf8_tied2, svmfloat8_t,
+		z0 = svtrn1q_mf8 (z1, z0),
+		z0 = svtrn1q (z1, z0))
+
+/*
+** trn1q_mf8_untied:
+**	trn1	z0\.q, z1\.q, z2\.q
+**	ret
+*/
+TEST_UNIFORM_Z (trn1q_mf8_untied, svmfloat8_t,
+		z0 = svtrn1q_mf8 (z1, z2),
+		z0 = svtrn1q (z1, z2))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/trn2_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/trn2_mf8.c
new file mode 100644
index 00000000000..8bdb8eda63e
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/trn2_mf8.c
@@ -0,0 +1,30 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** trn2_mf8_tied1:
+**	trn2	z0\.b, z0\.b, z1\.b
+**	ret
+*/
+TEST_UNIFORM_Z (trn2_mf8_tied1, svmfloat8_t,
+		z0 = svtrn2_mf8 (z0, z1),
+		z0 = svtrn2 (z0, z1))
+
+/*
+** trn2_mf8_tied2:
+**	trn2	z0\.b, z1\.b, z0\.b
+**	ret
+*/
+TEST_UNIFORM_Z (trn2_mf8_tied2, svmfloat8_t,
+		z0 = svtrn2_mf8 (z1, z0),
+		z0 = svtrn2 (z1, z0))
+
+/*
+** trn2_mf8_untied:
+**	trn2	z0\.b, z1\.b, z2\.b
+**	ret
+*/
+TEST_UNIFORM_Z (trn2_mf8_untied, svmfloat8_t,
+		z0 = svtrn2_mf8 (z1, z2),
+		z0 = svtrn2 (z1, z2))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/trn2q_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/trn2q_mf8.c
new file mode 100644
index 00000000000..a1fff6fd8d0
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/trn2q_mf8.c
@@ -0,0 +1,33 @@
+/* { dg-require-effective-target aarch64_asm_f64mm_ok } */
+/* { dg-additional-options "-march=armv8.2-a+f64mm" } */
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+/* { dg-skip-if "" { *-*-* } { "-DSTREAMING_COMPATIBLE" } { "" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** trn2q_mf8_tied1:
+**	trn2	z0\.q, z0\.q, z1\.q
+**	ret
+*/
+TEST_UNIFORM_Z (trn2q_mf8_tied1, svmfloat8_t,
+		z0 = svtrn2q_mf8 (z0, z1),
+		z0 = svtrn2q (z0, z1))
+
+/*
+** trn2q_mf8_tied2:
+**	trn2	z0\.q, z1\.q, z0\.q
+**	ret
+*/
+TEST_UNIFORM_Z (trn2q_mf8_tied2, svmfloat8_t,
+		z0 = svtrn2q_mf8 (z1, z0),
+		z0 = svtrn2q (z1, z0))
+
+/*
+** trn2q_mf8_untied:
+**	trn2	z0\.q, z1\.q, z2\.q
+**	ret
+*/
+TEST_UNIFORM_Z (trn2q_mf8_untied, svmfloat8_t,
+		z0 = svtrn2q_mf8 (z1, z2),
+		z0 = svtrn2q (z1, z2))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/undef2_1.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/undef2_1.c
index fe6c4c7c7d5..aeeddd8d15c 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/undef2_1.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/undef2_1.c
@@ -37,6 +37,13 @@ TEST_UNDEF (uint16, svuint16x2_t,
 TEST_UNDEF (float16, svfloat16x2_t,
 	    z0 = svundef2_f16 ())
 
+/*
+** mfloat8:
+**	ret
+*/
+TEST_UNDEF (mfloat8, svmfloat8x2_t,
+	    z0 = svundef2_mf8 ())
+
 /*
 ** bfloat16:
 **	ret
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/undef3_1.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/undef3_1.c
index 5c18c6317d1..f9a40895fb1 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/undef3_1.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/undef3_1.c
@@ -37,6 +37,13 @@ TEST_UNDEF (uint16, svuint16x3_t,
 TEST_UNDEF (float16, svfloat16x3_t,
 	    z0 = svundef3_f16 ())
 
+/*
+** mfloat8:
+**	ret
+*/
+TEST_UNDEF (mfloat8, svmfloat8x3_t,
+	    z0 = svundef3_mf8 ())
+
 /*
 ** bfloat16:
 **	ret
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/undef4_1.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/undef4_1.c
index 4d6b86b04b5..d8d8662ddd3 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/undef4_1.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/undef4_1.c
@@ -37,6 +37,13 @@ TEST_UNDEF (uint16, svuint16x4_t,
 TEST_UNDEF (float16, svfloat16x4_t,
 	    z0 = svundef4_f16 ())
 
+/*
+** mfloat8:
+**	ret
+*/
+TEST_UNDEF (mfloat8, svmfloat8x4_t,
+	    z0 = svundef4_mf8 ())
+
 /*
 ** bfloat16:
 **	ret
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/undef_1.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/undef_1.c
index 62873b6e1b3..bfa51b82f14 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/undef_1.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/undef_1.c
@@ -37,6 +37,13 @@ TEST_UNDEF (uint16, svuint16_t,
 TEST_UNDEF (float16, svfloat16_t,
 	    z0 = svundef_f16 ())
 
+/*
+** mfloat8:
+**	ret
+*/
+TEST_UNDEF (mfloat8, svmfloat8_t,
+	    z0 = svundef_mf8 ())
+
 /*
 ** bfloat16:
 **	ret
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/uzp1_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/uzp1_mf8.c
new file mode 100644
index 00000000000..c0bab36fff3
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/uzp1_mf8.c
@@ -0,0 +1,30 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** uzp1_mf8_tied1:
+**	uzp1	z0\.b, z0\.b, z1\.b
+**	ret
+*/
+TEST_UNIFORM_Z (uzp1_mf8_tied1, svmfloat8_t,
+		z0 = svuzp1_mf8 (z0, z1),
+		z0 = svuzp1 (z0, z1))
+
+/*
+** uzp1_mf8_tied2:
+**	uzp1	z0\.b, z1\.b, z0\.b
+**	ret
+*/
+TEST_UNIFORM_Z (uzp1_mf8_tied2, svmfloat8_t,
+		z0 = svuzp1_mf8 (z1, z0),
+		z0 = svuzp1 (z1, z0))
+
+/*
+** uzp1_mf8_untied:
+**	uzp1	z0\.b, z1\.b, z2\.b
+**	ret
+*/
+TEST_UNIFORM_Z (uzp1_mf8_untied, svmfloat8_t,
+		z0 = svuzp1_mf8 (z1, z2),
+		z0 = svuzp1 (z1, z2))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/uzp1q_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/uzp1q_mf8.c
new file mode 100644
index 00000000000..5a779dbf9c1
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/uzp1q_mf8.c
@@ -0,0 +1,33 @@
+/* { dg-skip-if "" { *-*-* } { "-DSTREAMING_COMPATIBLE" } { "" } } */
+/* { dg-require-effective-target aarch64_asm_f64mm_ok } */
+/* { dg-additional-options "-march=armv8.2-a+f64mm" } */
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** uzp1q_mf8_tied1:
+**	uzp1	z0\.q, z0\.q, z1\.q
+**	ret
+*/
+TEST_UNIFORM_Z (uzp1q_mf8_tied1, svmfloat8_t,
+		z0 = svuzp1q_mf8 (z0, z1),
+		z0 = svuzp1q (z0, z1))
+
+/*
+** uzp1q_mf8_tied2:
+**	uzp1	z0\.q, z1\.q, z0\.q
+**	ret
+*/
+TEST_UNIFORM_Z (uzp1q_mf8_tied2, svmfloat8_t,
+		z0 = svuzp1q_mf8 (z1, z0),
+		z0 = svuzp1q (z1, z0))
+
+/*
+** uzp1q_mf8_untied:
+**	uzp1	z0\.q, z1\.q, z2\.q
+**	ret
+*/
+TEST_UNIFORM_Z (uzp1q_mf8_untied, svmfloat8_t,
+		z0 = svuzp1q_mf8 (z1, z2),
+		z0 = svuzp1q (z1, z2))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/uzp2_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/uzp2_mf8.c
new file mode 100644
index 00000000000..91518b09e47
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/uzp2_mf8.c
@@ -0,0 +1,30 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** uzp2_mf8_tied1:
+**	uzp2	z0\.b, z0\.b, z1\.b
+**	ret
+*/
+TEST_UNIFORM_Z (uzp2_mf8_tied1, svmfloat8_t,
+		z0 = svuzp2_mf8 (z0, z1),
+		z0 = svuzp2 (z0, z1))
+
+/*
+** uzp2_mf8_tied2:
+**	uzp2	z0\.b, z1\.b, z0\.b
+**	ret
+*/
+TEST_UNIFORM_Z (uzp2_mf8_tied2, svmfloat8_t,
+		z0 = svuzp2_mf8 (z1, z0),
+		z0 = svuzp2 (z1, z0))
+
+/*
+** uzp2_mf8_untied:
+**	uzp2	z0\.b, z1\.b, z2\.b
+**	ret
+*/
+TEST_UNIFORM_Z (uzp2_mf8_untied, svmfloat8_t,
+		z0 = svuzp2_mf8 (z1, z2),
+		z0 = svuzp2 (z1, z2))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/uzp2q_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/uzp2q_mf8.c
new file mode 100644
index 00000000000..02a95fcd565
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/uzp2q_mf8.c
@@ -0,0 +1,33 @@
+/* { dg-require-effective-target aarch64_asm_f64mm_ok } */
+/* { dg-additional-options "-march=armv8.2-a+f64mm" } */
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+/* { dg-skip-if "" { *-*-* } { "-DSTREAMING_COMPATIBLE" } { "" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** uzp2q_mf8_tied1:
+**	uzp2	z0\.q, z0\.q, z1\.q
+**	ret
+*/
+TEST_UNIFORM_Z (uzp2q_mf8_tied1, svmfloat8_t,
+		z0 = svuzp2q_mf8 (z0, z1),
+		z0 = svuzp2q (z0, z1))
+
+/*
+** uzp2q_mf8_tied2:
+**	uzp2	z0\.q, z1\.q, z0\.q
+**	ret
+*/
+TEST_UNIFORM_Z (uzp2q_mf8_tied2, svmfloat8_t,
+		z0 = svuzp2q_mf8 (z1, z0),
+		z0 = svuzp2q (z1, z0))
+
+/*
+** uzp2q_mf8_untied:
+**	uzp2	z0\.q, z1\.q, z2\.q
+**	ret
+*/
+TEST_UNIFORM_Z (uzp2q_mf8_untied, svmfloat8_t,
+		z0 = svuzp2q_mf8 (z1, z2),
+		z0 = svuzp2q (z1, z2))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/zip1_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/zip1_mf8.c
new file mode 100644
index 00000000000..97b5e0f3cf3
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/zip1_mf8.c
@@ -0,0 +1,30 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** zip1_mf8_tied1:
+**	zip1	z0\.b, z0\.b, z1\.b
+**	ret
+*/
+TEST_UNIFORM_Z (zip1_mf8_tied1, svmfloat8_t,
+		z0 = svzip1_mf8 (z0, z1),
+		z0 = svzip1 (z0, z1))
+
+/*
+** zip1_mf8_tied2:
+**	zip1	z0\.b, z1\.b, z0\.b
+**	ret
+*/
+TEST_UNIFORM_Z (zip1_mf8_tied2, svmfloat8_t,
+		z0 = svzip1_mf8 (z1, z0),
+		z0 = svzip1 (z1, z0))
+
+/*
+** zip1_mf8_untied:
+**	zip1	z0\.b, z1\.b, z2\.b
+**	ret
+*/
+TEST_UNIFORM_Z (zip1_mf8_untied, svmfloat8_t,
+		z0 = svzip1_mf8 (z1, z2),
+		z0 = svzip1 (z1, z2))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/zip1q_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/zip1q_mf8.c
new file mode 100644
index 00000000000..b0b438eebde
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/zip1q_mf8.c
@@ -0,0 +1,33 @@
+/* { dg-require-effective-target aarch64_asm_f64mm_ok } */
+/* { dg-additional-options "-march=armv8.2-a+f64mm" } */
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+/* { dg-skip-if "" { *-*-* } { "-DSTREAMING_COMPATIBLE" } { "" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** zip1q_mf8_tied1:
+**	zip1	z0\.q, z0\.q, z1\.q
+**	ret
+*/
+TEST_UNIFORM_Z (zip1q_mf8_tied1, svmfloat8_t,
+		z0 = svzip1q_mf8 (z0, z1),
+		z0 = svzip1q (z0, z1))
+
+/*
+** zip1q_mf8_tied2:
+**	zip1	z0\.q, z1\.q, z0\.q
+**	ret
+*/
+TEST_UNIFORM_Z (zip1q_mf8_tied2, svmfloat8_t,
+		z0 = svzip1q_mf8 (z1, z0),
+		z0 = svzip1q (z1, z0))
+
+/*
+** zip1q_mf8_untied:
+**	zip1	z0\.q, z1\.q, z2\.q
+**	ret
+*/
+TEST_UNIFORM_Z (zip1q_mf8_untied, svmfloat8_t,
+		z0 = svzip1q_mf8 (z1, z2),
+		z0 = svzip1q (z1, z2))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/zip2_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/zip2_mf8.c
new file mode 100644
index 00000000000..96244fb3627
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/zip2_mf8.c
@@ -0,0 +1,30 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** zip2_mf8_tied1:
+**	zip2	z0\.b, z0\.b, z1\.b
+**	ret
+*/
+TEST_UNIFORM_Z (zip2_mf8_tied1, svmfloat8_t,
+		z0 = svzip2_mf8 (z0, z1),
+		z0 = svzip2 (z0, z1))
+
+/*
+** zip2_mf8_tied2:
+**	zip2	z0\.b, z1\.b, z0\.b
+**	ret
+*/
+TEST_UNIFORM_Z (zip2_mf8_tied2, svmfloat8_t,
+		z0 = svzip2_mf8 (z1, z0),
+		z0 = svzip2 (z1, z0))
+
+/*
+** zip2_mf8_untied:
+**	zip2	z0\.b, z1\.b, z2\.b
+**	ret
+*/
+TEST_UNIFORM_Z (zip2_mf8_untied, svmfloat8_t,
+		z0 = svzip2_mf8 (z1, z2),
+		z0 = svzip2 (z1, z2))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/zip2q_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/zip2q_mf8.c
new file mode 100644
index 00000000000..05bf1de8488
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/zip2q_mf8.c
@@ -0,0 +1,33 @@
+/* { dg-require-effective-target aarch64_asm_f64mm_ok } */
+/* { dg-additional-options "-march=armv8.2-a+f64mm" } */
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+/* { dg-skip-if "" { *-*-* } { "-DSTREAMING_COMPATIBLE" } { "" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** zip2q_mf8_tied1:
+**	zip2	z0\.q, z0\.q, z1\.q
+**	ret
+*/
+TEST_UNIFORM_Z (zip2q_mf8_tied1, svmfloat8_t,
+		z0 = svzip2q_mf8 (z0, z1),
+		z0 = svzip2q (z0, z1))
+
+/*
+** zip2q_mf8_tied2:
+**	zip2	z0\.q, z1\.q, z0\.q
+**	ret
+*/
+TEST_UNIFORM_Z (zip2q_mf8_tied2, svmfloat8_t,
+		z0 = svzip2q_mf8 (z1, z0),
+		z0 = svzip2q (z1, z0))
+
+/*
+** zip2q_mf8_untied:
+**	zip2	z0\.q, z1\.q, z2\.q
+**	ret
+*/
+TEST_UNIFORM_Z (zip2q_mf8_untied, svmfloat8_t,
+		z0 = svzip2q_mf8 (z1, z2),
+		z0 = svzip2q (z1, z2))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/pcs/annotate_1.c b/gcc/testsuite/gcc.target/aarch64/sve/pcs/annotate_1.c
index c3ac692d7ff..a85d068607a 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/pcs/annotate_1.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/pcs/annotate_1.c
@@ -14,6 +14,7 @@ svuint8_t ret_u8 (void) { return svdup_u8 (0); }
 svuint16_t ret_u16 (void) { return svdup_u16 (0); }
 svuint32_t ret_u32 (void) { return svdup_u32 (0); }
 svuint64_t ret_u64 (void) { return svdup_u64 (0); }
+svmfloat8_t ret_mf8 (void) { return svundef_mf8 (); }
 svbfloat16_t ret_bf16 (void) { return svundef_bf16 (); }
 svfloat16_t ret_f16 (void) { return svdup_f16 (0); }
 svfloat32_t ret_f32 (void) { return svdup_f32 (0); }
@@ -27,6 +28,7 @@ svuint8x2_t ret_u8x2 (void) { return svundef2_u8 (); }
 svuint16x2_t ret_u16x2 (void) { return svundef2_u16 (); }
 svuint32x2_t ret_u32x2 (void) { return svundef2_u32 (); }
 svuint64x2_t ret_u64x2 (void) { return svundef2_u64 (); }
+svmfloat8x2_t ret_mf8x2 (void) { return svundef2_mf8 (); }
 svbfloat16x2_t ret_bf16x2 (void) { return svundef2_bf16 (); }
 svfloat16x2_t ret_f16x2 (void) { return svundef2_f16 (); }
 svfloat32x2_t ret_f32x2 (void) { return svundef2_f32 (); }
@@ -40,6 +42,7 @@ svuint8x3_t ret_u8x3 (void) { return svundef3_u8 (); }
 svuint16x3_t ret_u16x3 (void) { return svundef3_u16 (); }
 svuint32x3_t ret_u32x3 (void) { return svundef3_u32 (); }
 svuint64x3_t ret_u64x3 (void) { return svundef3_u64 (); }
+svmfloat8x3_t ret_mf8x3 (void) { return svundef3_mf8 (); }
 svbfloat16x3_t ret_bf16x3 (void) { return svundef3_bf16 (); }
 svfloat16x3_t ret_f16x3 (void) { return svundef3_f16 (); }
 svfloat32x3_t ret_f32x3 (void) { return svundef3_f32 (); }
@@ -53,6 +56,7 @@ svuint8x4_t ret_u8x4 (void) { return svundef4_u8 (); }
 svuint16x4_t ret_u16x4 (void) { return svundef4_u16 (); }
 svuint32x4_t ret_u32x4 (void) { return svundef4_u32 (); }
 svuint64x4_t ret_u64x4 (void) { return svundef4_u64 (); }
+svmfloat8x4_t ret_mf8x4 (void) { return svundef4_mf8 (); }
 svbfloat16x4_t ret_bf16x4 (void) { return svundef4_bf16 (); }
 svfloat16x4_t ret_f16x4 (void) { return svundef4_f16 (); }
 svfloat32x4_t ret_f32x4 (void) { return svundef4_f32 (); }
@@ -70,6 +74,7 @@ svfloat64x4_t ret_f64x4 (void) { return svundef4_f64 (); }
 /* { dg-final { scan-assembler {\t\.variant_pcs\tret_u16\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tret_u32\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tret_u64\n} } } */
+/* { dg-final { scan-assembler {\t\.variant_pcs\tret_mf8\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tret_bf16\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tret_f16\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tret_f32\n} } } */
@@ -83,6 +88,7 @@ svfloat64x4_t ret_f64x4 (void) { return svundef4_f64 (); }
 /* { dg-final { scan-assembler {\t\.variant_pcs\tret_u16x2\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tret_u32x2\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tret_u64x2\n} } } */
+/* { dg-final { scan-assembler {\t\.variant_pcs\tret_mf8x2\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tret_bf16x2\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tret_f16x2\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tret_f32x2\n} } } */
@@ -97,6 +103,7 @@ svfloat64x4_t ret_f64x4 (void) { return svundef4_f64 (); }
 /* { dg-final { scan-assembler {\t\.variant_pcs\tret_u16x3\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tret_u32x3\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tret_u64x3\n} } } */
+/* { dg-final { scan-assembler {\t\.variant_pcs\tret_mf8x3\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tret_bf16x3\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tret_f16x3\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tret_f32x3\n} } } */
@@ -110,6 +117,7 @@ svfloat64x4_t ret_f64x4 (void) { return svundef4_f64 (); }
 /* { dg-final { scan-assembler {\t\.variant_pcs\tret_u16x4\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tret_u32x4\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tret_u64x4\n} } } */
+/* { dg-final { scan-assembler {\t\.variant_pcs\tret_mf8x4\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tret_bf16x4\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tret_f16x4\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tret_f32x4\n} } } */
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/pcs/annotate_2.c b/gcc/testsuite/gcc.target/aarch64/sve/pcs/annotate_2.c
index c3508735fc4..eb9e28044da 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/pcs/annotate_2.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/pcs/annotate_2.c
@@ -14,6 +14,7 @@ void fn_u8 (svuint8_t x) {}
 void fn_u16 (svuint16_t x) {}
 void fn_u32 (svuint32_t x) {}
 void fn_u64 (svuint64_t x) {}
+void fn_mf8 (svmfloat8_t x) {}
 void fn_bf16 (svbfloat16_t x) {}
 void fn_f16 (svfloat16_t x) {}
 void fn_f32 (svfloat32_t x) {}
@@ -27,6 +28,7 @@ void fn_u8x2 (svuint8x2_t x) {}
 void fn_u16x2 (svuint16x2_t x) {}
 void fn_u32x2 (svuint32x2_t x) {}
 void fn_u64x2 (svuint64x2_t x) {}
+void fn_mf8x2 (svmfloat8x2_t x) {}
 void fn_bf16x2 (svbfloat16x2_t x) {}
 void fn_f16x2 (svfloat16x2_t x) {}
 void fn_f32x2 (svfloat32x2_t x) {}
@@ -40,6 +42,7 @@ void fn_u8x3 (svuint8x3_t x) {}
 void fn_u16x3 (svuint16x3_t x) {}
 void fn_u32x3 (svuint32x3_t x) {}
 void fn_u64x3 (svuint64x3_t x) {}
+void fn_mf8x3 (svmfloat8x3_t x) {}
 void fn_bf16x3 (svbfloat16x3_t x) {}
 void fn_f16x3 (svfloat16x3_t x) {}
 void fn_f32x3 (svfloat32x3_t x) {}
@@ -53,6 +56,7 @@ void fn_u8x4 (svuint8x4_t x) {}
 void fn_u16x4 (svuint16x4_t x) {}
 void fn_u32x4 (svuint32x4_t x) {}
 void fn_u64x4 (svuint64x4_t x) {}
+void fn_mf8x4 (svmfloat8x4_t x) {}
 void fn_bf16x4 (svbfloat16x4_t x) {}
 void fn_f16x4 (svfloat16x4_t x) {}
 void fn_f32x4 (svfloat32x4_t x) {}
@@ -70,6 +74,7 @@ void fn_f64x4 (svfloat64x4_t x) {}
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u16\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u32\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u64\n} } } */
+/* { dg-final { scan-assembler {\t\.variant_pcs\tfn_mf8\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_bf16\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_f16\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_f32\n} } } */
@@ -83,6 +88,7 @@ void fn_f64x4 (svfloat64x4_t x) {}
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u16x2\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u32x2\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u64x2\n} } } */
+/* { dg-final { scan-assembler {\t\.variant_pcs\tfn_mf8x2\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_bf16x2\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_f16x2\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_f32x2\n} } } */
@@ -96,6 +102,7 @@ void fn_f64x4 (svfloat64x4_t x) {}
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u16x3\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u32x3\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u64x3\n} } } */
+/* { dg-final { scan-assembler {\t\.variant_pcs\tfn_mf8x3\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_bf16x3\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_f16x3\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_f32x3\n} } } */
@@ -109,6 +116,7 @@ void fn_f64x4 (svfloat64x4_t x) {}
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u16x4\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u32x4\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u64x4\n} } } */
+/* { dg-final { scan-assembler {\t\.variant_pcs\tfn_mf8x4\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_bf16x4\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_f16x4\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_f32x4\n} } } */
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/pcs/annotate_3.c b/gcc/testsuite/gcc.target/aarch64/sve/pcs/annotate_3.c
index 42e7860ff7e..a6e9fc64960 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/pcs/annotate_3.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/pcs/annotate_3.c
@@ -10,6 +10,7 @@ void fn_u8 (float d0, float d1, float d2, float d3, svuint8_t x) {}
 void fn_u16 (float d0, float d1, float d2, float d3, svuint16_t x) {}
 void fn_u32 (float d0, float d1, float d2, float d3, svuint32_t x) {}
 void fn_u64 (float d0, float d1, float d2, float d3, svuint64_t x) {}
+void fn_mf8 (float d0, float d1, float d2, float d3, svmfloat8_t x) {}
 void fn_bf16 (float d0, float d1, float d2, float d3, svbfloat16_t x) {}
 void fn_f16 (float d0, float d1, float d2, float d3, svfloat16_t x) {}
 void fn_f32 (float d0, float d1, float d2, float d3, svfloat32_t x) {}
@@ -23,6 +24,7 @@ void fn_u8x2 (float d0, float d1, float d2, float d3, svuint8x2_t x) {}
 void fn_u16x2 (float d0, float d1, float d2, float d3, svuint16x2_t x) {}
 void fn_u32x2 (float d0, float d1, float d2, float d3, svuint32x2_t x) {}
 void fn_u64x2 (float d0, float d1, float d2, float d3, svuint64x2_t x) {}
+void fn_mf8x2 (float d0, float d1, float d2, float d3, svmfloat8x2_t x) {}
 void fn_bf16x2 (float d0, float d1, float d2, float d3, svbfloat16x2_t x) {}
 void fn_f16x2 (float d0, float d1, float d2, float d3, svfloat16x2_t x) {}
 void fn_f32x2 (float d0, float d1, float d2, float d3, svfloat32x2_t x) {}
@@ -36,6 +38,7 @@ void fn_u8x3 (float d0, float d1, float d2, float d3, svuint8x3_t x) {}
 void fn_u16x3 (float d0, float d1, float d2, float d3, svuint16x3_t x) {}
 void fn_u32x3 (float d0, float d1, float d2, float d3, svuint32x3_t x) {}
 void fn_u64x3 (float d0, float d1, float d2, float d3, svuint64x3_t x) {}
+void fn_mf8x3 (float d0, float d1, float d2, float d3, svmfloat8x3_t x) {}
 void fn_bf16x3 (float d0, float d1, float d2, float d3, svbfloat16x3_t x) {}
 void fn_f16x3 (float d0, float d1, float d2, float d3, svfloat16x3_t x) {}
 void fn_f32x3 (float d0, float d1, float d2, float d3, svfloat32x3_t x) {}
@@ -49,6 +52,7 @@ void fn_u8x4 (float d0, float d1, float d2, float d3, svuint8x4_t x) {}
 void fn_u16x4 (float d0, float d1, float d2, float d3, svuint16x4_t x) {}
 void fn_u32x4 (float d0, float d1, float d2, float d3, svuint32x4_t x) {}
 void fn_u64x4 (float d0, float d1, float d2, float d3, svuint64x4_t x) {}
+void fn_mf8x4 (float d0, float d1, float d2, float d3, svmfloat8x4_t x) {}
 void fn_bf16x4 (float d0, float d1, float d2, float d3, svbfloat16x4_t x) {}
 void fn_f16x4 (float d0, float d1, float d2, float d3, svfloat16x4_t x) {}
 void fn_f32x4 (float d0, float d1, float d2, float d3, svfloat32x4_t x) {}
@@ -62,6 +66,7 @@ void fn_f64x4 (float d0, float d1, float d2, float d3, svfloat64x4_t x) {}
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u16\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u32\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u64\n} } } */
+/* { dg-final { scan-assembler {\t\.variant_pcs\tfn_mf8\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_bf16\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_f16\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_f32\n} } } */
@@ -75,6 +80,7 @@ void fn_f64x4 (float d0, float d1, float d2, float d3, svfloat64x4_t x) {}
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u16x2\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u32x2\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u64x2\n} } } */
+/* { dg-final { scan-assembler {\t\.variant_pcs\tfn_mf8x2\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_bf16x2\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_f16x2\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_f32x2\n} } } */
@@ -88,6 +94,7 @@ void fn_f64x4 (float d0, float d1, float d2, float d3, svfloat64x4_t x) {}
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u16x3\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u32x3\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u64x3\n} } } */
+/* { dg-final { scan-assembler {\t\.variant_pcs\tfn_mf8x3\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_bf16x3\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_f16x3\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_f32x3\n} } } */
@@ -101,6 +108,7 @@ void fn_f64x4 (float d0, float d1, float d2, float d3, svfloat64x4_t x) {}
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u16x4\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u32x4\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u64x4\n} } } */
+/* { dg-final { scan-assembler {\t\.variant_pcs\tfn_mf8x4\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_bf16x4\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_f16x4\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_f32x4\n} } } */
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/pcs/annotate_4.c b/gcc/testsuite/gcc.target/aarch64/sve/pcs/annotate_4.c
index 7e4438ed49a..240c1c9faae 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/pcs/annotate_4.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/pcs/annotate_4.c
@@ -18,6 +18,8 @@ void fn_u32 (float d0, float d1, float d2, float d3,
 	     float d4, svuint32_t x) {}
 void fn_u64 (float d0, float d1, float d2, float d3,
 	     float d4, svuint64_t x) {}
+void fn_mf8 (float d0, float d1, float d2, float d3,
+	      float d4, svmfloat8_t x) {}
 void fn_bf16 (float d0, float d1, float d2, float d3,
 	      float d4, svbfloat16_t x) {}
 void fn_f16 (float d0, float d1, float d2, float d3,
@@ -43,6 +45,8 @@ void fn_u32x2 (float d0, float d1, float d2, float d3,
 	       float d4, svuint32x2_t x) {}
 void fn_u64x2 (float d0, float d1, float d2, float d3,
 	       float d4, svuint64x2_t x) {}
+void fn_mf8x2 (float d0, float d1, float d2, float d3,
+	      float d4, svmfloat8x2_t x) {}
 void fn_bf16x2 (float d0, float d1, float d2, float d3,
 		float d4, svbfloat16x2_t x) {}
 void fn_f16x2 (float d0, float d1, float d2, float d3,
@@ -68,6 +72,8 @@ void fn_u32x3 (float d0, float d1, float d2, float d3,
 	       float d4, svuint32x3_t x) {}
 void fn_u64x3 (float d0, float d1, float d2, float d3,
 	       float d4, svuint64x3_t x) {}
+void fn_mf8x3 (float d0, float d1, float d2, float d3,
+	      float d4, svmfloat8x3_t x) {}
 void fn_bf16x3 (float d0, float d1, float d2, float d3,
 		float d4, svbfloat16x3_t x) {}
 void fn_f16x3 (float d0, float d1, float d2, float d3,
@@ -93,6 +99,8 @@ void fn_u32x4 (float d0, float d1, float d2, float d3,
 	       float d4, svuint32x4_t x) {}
 void fn_u64x4 (float d0, float d1, float d2, float d3,
 	       float d4, svuint64x4_t x) {}
+void fn_mf8x4 (float d0, float d1, float d2, float d3,
+	      float d4, svmfloat8x4_t x) {}
 void fn_bf16x4 (float d0, float d1, float d2, float d3,
 		float d4, svbfloat16x4_t x) {}
 void fn_f16x4 (float d0, float d1, float d2, float d3,
@@ -110,6 +118,7 @@ void fn_f64x4 (float d0, float d1, float d2, float d3,
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u16\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u32\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u64\n} } } */
+/* { dg-final { scan-assembler {\t\.variant_pcs\tfn_mf8\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_bf16\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_f16\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_f32\n} } } */
@@ -123,6 +132,7 @@ void fn_f64x4 (float d0, float d1, float d2, float d3,
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u16x2\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u32x2\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u64x2\n} } } */
+/* { dg-final { scan-assembler {\t\.variant_pcs\tfn_mf8x2\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_bf16x2\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_f16x2\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_f32x2\n} } } */
@@ -136,6 +146,7 @@ void fn_f64x4 (float d0, float d1, float d2, float d3,
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u16x3\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u32x3\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u64x3\n} } } */
+/* { dg-final { scan-assembler {\t\.variant_pcs\tfn_mf8x3\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_bf16x3\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_f16x3\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_f32x3\n} } } */
@@ -149,6 +160,7 @@ void fn_f64x4 (float d0, float d1, float d2, float d3,
 /* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_u16x4\n} } } */
 /* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_u32x4\n} } } */
 /* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_u64x4\n} } } */
+/* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_mf8x4\n} } } */
 /* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_bf16x4\n} } } */
 /* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_f16x4\n} } } */
 /* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_f32x4\n} } } */
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/pcs/annotate_5.c b/gcc/testsuite/gcc.target/aarch64/sve/pcs/annotate_5.c
index 6dadc0492cd..0ff1df3b31d 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/pcs/annotate_5.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/pcs/annotate_5.c
@@ -18,6 +18,8 @@ void fn_u32 (float d0, float d1, float d2, float d3,
 	     float d4, float d5, svuint32_t x) {}
 void fn_u64 (float d0, float d1, float d2, float d3,
 	     float d4, float d5, svuint64_t x) {}
+void fn_mf8 (float d0, float d1, float d2, float d3,
+	      float d4, float d5, svmfloat8_t x) {}
 void fn_bf16 (float d0, float d1, float d2, float d3,
 	      float d4, float d5, svbfloat16_t x) {}
 void fn_f16 (float d0, float d1, float d2, float d3,
@@ -43,6 +45,8 @@ void fn_u32x2 (float d0, float d1, float d2, float d3,
 	       float d4, float d5, svuint32x2_t x) {}
 void fn_u64x2 (float d0, float d1, float d2, float d3,
 	       float d4, float d5, svuint64x2_t x) {}
+void fn_mf8x2 (float d0, float d1, float d2, float d3,
+	      float d4, float d5, svmfloat8x2_t x) {}
 void fn_bf16x2 (float d0, float d1, float d2, float d3,
 		float d4, float d5, svbfloat16x2_t x) {}
 void fn_f16x2 (float d0, float d1, float d2, float d3,
@@ -68,6 +72,8 @@ void fn_u32x3 (float d0, float d1, float d2, float d3,
 	       float d4, float d5, svuint32x3_t x) {}
 void fn_u64x3 (float d0, float d1, float d2, float d3,
 	       float d4, float d5, svuint64x3_t x) {}
+void fn_mf8x3 (float d0, float d1, float d2, float d3,
+	      float d4, float d5, svmfloat8x3_t x) {}
 void fn_bf16x3 (float d0, float d1, float d2, float d3,
 		float d4, float d5, svbfloat16x3_t x) {}
 void fn_f16x3 (float d0, float d1, float d2, float d3,
@@ -93,6 +99,8 @@ void fn_u32x4 (float d0, float d1, float d2, float d3,
 	       float d4, float d5, svuint32x4_t x) {}
 void fn_u64x4 (float d0, float d1, float d2, float d3,
 	       float d4, float d5, svuint64x4_t x) {}
+void fn_mf8x4 (float d0, float d1, float d2, float d3,
+	      float d4, float d5, svmfloat8x4_t x) {}
 void fn_bf16x4 (float d0, float d1, float d2, float d3,
 		float d4, float d5, svbfloat16x4_t x) {}
 void fn_f16x4 (float d0, float d1, float d2, float d3,
@@ -110,6 +118,7 @@ void fn_f64x4 (float d0, float d1, float d2, float d3,
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u16\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u32\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u64\n} } } */
+/* { dg-final { scan-assembler {\t\.variant_pcs\tfn_mf8\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_bf16\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_f16\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_f32\n} } } */
@@ -123,6 +132,7 @@ void fn_f64x4 (float d0, float d1, float d2, float d3,
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u16x2\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u32x2\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u64x2\n} } } */
+/* { dg-final { scan-assembler {\t\.variant_pcs\tfn_mf8x2\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_bf16x2\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_f16x2\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_f32x2\n} } } */
@@ -136,6 +146,7 @@ void fn_f64x4 (float d0, float d1, float d2, float d3,
 /* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_u16x3\n} } } */
 /* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_u32x3\n} } } */
 /* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_u64x3\n} } } */
+/* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_mf8x3\n} } } */
 /* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_bf16x3\n} } } */
 /* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_f16x3\n} } } */
 /* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_f32x3\n} } } */
@@ -149,6 +160,7 @@ void fn_f64x4 (float d0, float d1, float d2, float d3,
 /* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_u16x4\n} } } */
 /* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_u32x4\n} } } */
 /* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_u64x4\n} } } */
+/* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_mf8x4\n} } } */
 /* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_bf16x4\n} } } */
 /* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_f16x4\n} } } */
 /* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_f32x4\n} } } */
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/pcs/annotate_6.c b/gcc/testsuite/gcc.target/aarch64/sve/pcs/annotate_6.c
index 0ff73e2598e..019e76476c4 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/pcs/annotate_6.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/pcs/annotate_6.c
@@ -18,6 +18,8 @@ void fn_u32 (float d0, float d1, float d2, float d3,
 	     float d4, float d5, float d6, svuint32_t x) {}
 void fn_u64 (float d0, float d1, float d2, float d3,
 	     float d4, float d5, float d6, svuint64_t x) {}
+void fn_mf8 (float d0, float d1, float d2, float d3,
+	      float d4, float d5, float d6, svmfloat8_t x) {}
 void fn_bf16 (float d0, float d1, float d2, float d3,
 	      float d4, float d5, float d6, svbfloat16_t x) {}
 void fn_f16 (float d0, float d1, float d2, float d3,
@@ -43,6 +45,8 @@ void fn_u32x2 (float d0, float d1, float d2, float d3,
 	       float d4, float d5, float d6, svuint32x2_t x) {}
 void fn_u64x2 (float d0, float d1, float d2, float d3,
 	       float d4, float d5, float d6, svuint64x2_t x) {}
+void fn_mf8x2 (float d0, float d1, float d2, float d3,
+	      float d4, float d5, float d6, svmfloat8x2_t x) {}
 void fn_bf16x2 (float d0, float d1, float d2, float d3,
 		float d4, float d5, float d6, svbfloat16x2_t x) {}
 void fn_f16x2 (float d0, float d1, float d2, float d3,
@@ -68,6 +72,8 @@ void fn_u32x3 (float d0, float d1, float d2, float d3,
 	       float d4, float d5, float d6, svuint32x3_t x) {}
 void fn_u64x3 (float d0, float d1, float d2, float d3,
 	       float d4, float d5, float d6, svuint64x3_t x) {}
+void fn_mf8x3 (float d0, float d1, float d2, float d3,
+	      float d4, float d5, float d6, svmfloat8x3_t x) {}
 void fn_bf16x3 (float d0, float d1, float d2, float d3,
 		float d4, float d5, float d6, svbfloat16x3_t x) {}
 void fn_f16x3 (float d0, float d1, float d2, float d3,
@@ -93,6 +99,8 @@ void fn_u32x4 (float d0, float d1, float d2, float d3,
 	       float d4, float d5, float d6, svuint32x4_t x) {}
 void fn_u64x4 (float d0, float d1, float d2, float d3,
 	       float d4, float d5, float d6, svuint64x4_t x) {}
+void fn_mf8x4 (float d0, float d1, float d2, float d3,
+	      float d4, float d5, float d6, svmfloat8x4_t x) {}
 void fn_bf16x4 (float d0, float d1, float d2, float d3,
 		float d4, float d5, float d6, svbfloat16x4_t x) {}
 void fn_f16x4 (float d0, float d1, float d2, float d3,
@@ -110,6 +118,7 @@ void fn_f64x4 (float d0, float d1, float d2, float d3,
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u16\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u32\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_u64\n} } } */
+/* { dg-final { scan-assembler {\t\.variant_pcs\tfn_mf8\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_bf16\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_f16\n} } } */
 /* { dg-final { scan-assembler {\t\.variant_pcs\tfn_f32\n} } } */
@@ -123,6 +132,7 @@ void fn_f64x4 (float d0, float d1, float d2, float d3,
 /* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_u16x2\n} } } */
 /* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_u32x2\n} } } */
 /* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_u64x2\n} } } */
+/* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_mf8x2\n} } } */
 /* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_bf16x2\n} } } */
 /* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_f16x2\n} } } */
 /* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_f32x2\n} } } */
@@ -136,6 +146,7 @@ void fn_f64x4 (float d0, float d1, float d2, float d3,
 /* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_u16x3\n} } } */
 /* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_u32x3\n} } } */
 /* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_u64x3\n} } } */
+/* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_mf8x3\n} } } */
 /* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_bf16x3\n} } } */
 /* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_f16x3\n} } } */
 /* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_f32x3\n} } } */
@@ -149,6 +160,7 @@ void fn_f64x4 (float d0, float d1, float d2, float d3,
 /* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_u16x4\n} } } */
 /* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_u32x4\n} } } */
 /* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_u64x4\n} } } */
+/* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_mf8x4\n} } } */
 /* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_bf16x4\n} } } */
 /* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_f16x4\n} } } */
 /* { dg-final { scan-assembler-not {\t\.variant_pcs\tfn_f32x4\n} } } */
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/pcs/annotate_7.c b/gcc/testsuite/gcc.target/aarch64/sve/pcs/annotate_7.c
index 4f3ff810778..bb1cee0db56 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/pcs/annotate_7.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/pcs/annotate_7.c
@@ -18,6 +18,8 @@ void fn_u32 (float d0, float d1, float d2, float d3,
 	     float d4, float d5, float d6, float d7, svuint32_t x) {}
 void fn_u64 (float d0, float d1, float d2, float d3,
 	     float d4, float d5, float d6, float d7, svuint64_t x) {}
+void fn_mf8 (float d0, float d1, float d2, float d3,
+	      float d4, float d5, float d6, float d7, svmfloat8_t x) {}
 void fn_bf16 (float d0, float d1, float d2, float d3,
 	      float d4, float d5, float d6, float d7, svbfloat16_t x) {}
 void fn_f16 (float d0, float d1, float d2, float d3,
@@ -43,6 +45,8 @@ void fn_u32x2 (float d0, float d1, float d2, float d3,
 	       float d4, float d5, float d6, float d7, svuint32x2_t x) {}
 void fn_u64x2 (float d0, float d1, float d2, float d3,
 	       float d4, float d5, float d6, float d7, svuint64x2_t x) {}
+void fn_mf8x2 (float d0, float d1, float d2, float d3,
+	      float d4, float d5, float d6, float d7, svmfloat8x2_t x) {}
 void fn_bf16x2 (float d0, float d1, float d2, float d3,
 		float d4, float d5, float d6, float d7, svbfloat16x2_t x) {}
 void fn_f16x2 (float d0, float d1, float d2, float d3,
@@ -68,6 +72,8 @@ void fn_u32x3 (float d0, float d1, float d2, float d3,
 	       float d4, float d5, float d6, float d7, svuint32x3_t x) {}
 void fn_u64x3 (float d0, float d1, float d2, float d3,
 	       float d4, float d5, float d6, float d7, svuint64x3_t x) {}
+void fn_mf8x3 (float d0, float d1, float d2, float d3,
+	      float d4, float d5, float d6, float d7, svmfloat8x3_t x) {}
 void fn_bf16x3 (float d0, float d1, float d2, float d3,
 		float d4, float d5, float d6, float d7, svbfloat16x3_t x) {}
 void fn_f16x3 (float d0, float d1, float d2, float d3,
@@ -93,6 +99,8 @@ void fn_u32x4 (float d0, float d1, float d2, float d3,
 	       float d4, float d5, float d6, float d7, svuint32x4_t x) {}
 void fn_u64x4 (float d0, float d1, float d2, float d3,
 	       float d4, float d5, float d6, float d7, svuint64x4_t x) {}
+void fn_mf8x4 (float d0, float d1, float d2, float d3,
+	      float d4, float d5, float d6, float d7, svmfloat8x4_t x) {}
 void fn_bf16x4 (float d0, float d1, float d2, float d3,
 		float d4, float d5, float d6, float d7, svbfloat16x4_t x) {}
 void fn_f16x4 (float d0, float d1, float d2, float d3,
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/pcs/args_5_be_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/pcs/args_5_be_mf8.c
new file mode 100644
index 00000000000..3bd18a92393
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/pcs/args_5_be_mf8.c
@@ -0,0 +1,63 @@
+/* { dg-do compile { target lp64 } } */
+/* { dg-options "-O -mbig-endian -fno-stack-clash-protection -g" } */
+/* { dg-final { check-function-bodies "**" "" } } */
+
+#pragma GCC aarch64 "arm_sve.h"
+
+/*
+** callee:
+**	addvl	sp, sp, #-1
+**	str	(p[4-7]), \[sp\]
+**	ptrue	\1\.b, all
+** (
+**	ld1b	(z[0-9]+\.b), \1/z, \[x1, #1, mul vl\]
+**	ld1b	(z[0-9]+\.b), \1/z, \[x1\]
+**	st2b	{\3 - \2}, p0, \[x0\]
+** |
+**	ld1b	(z[0-9]+\.b), \1/z, \[x1\]
+**	ld1b	(z[0-9]+\.b), \1/z, \[x1, #1, mul vl\]
+**	st2b	{\4 - \5}, p0, \[x0\]
+** )
+**	st4b	{z0\.b - z3\.b}, p1, \[x0\]
+**	st3b	{z4\.b - z6\.b}, p2, \[x0\]
+**	st1b	z7\.b, p3, \[x0\]
+**	ldr	\1, \[sp\]
+**	addvl	sp, sp, #1
+**	ret
+*/
+void __attribute__((noipa))
+callee (void *x0, svmfloat8x4_t z0, svmfloat8x3_t z4, svmfloat8x2_t stack,
+	svmfloat8_t z7, svbool_t p0, svbool_t p1, svbool_t p2, svbool_t p3)
+{
+  svst2 (p0, x0, stack);
+  svst4 (p1, x0, z0);
+  svst3 (p2, x0, z4);
+  svst1_mf8 (p3, x0, z7);
+}
+
+void __attribute__((noipa))
+caller (void *x0)
+{
+  svbool_t pg;
+  pg = svptrue_b8 ();
+  callee (x0,
+	  svld4_vnum_mf8 (pg, x0, -8),
+	  svld3_vnum_mf8 (pg, x0, -3),
+	  svld2_vnum_mf8 (pg, x0, 0),
+	  svld1_vnum_mf8 (pg, x0, 2),
+	  svptrue_pat_b8 (SV_VL1),
+	  svptrue_pat_b16 (SV_VL2),
+	  svptrue_pat_b32 (SV_VL3),
+	  svptrue_pat_b64 (SV_VL4));
+}
+
+/* { dg-final { scan-assembler {\tld4b\t{z0\.b - z3\.b}, p[0-7]/z, \[x0, #-8, mul vl\]\n} } } */
+/* { dg-final { scan-assembler {\tld3b\t{z4\.b - z6\.b}, p[0-7]/z, \[x0, #-3, mul vl\]\n} } } */
+/* { dg-final { scan-assembler {\tld1b\tz7\.b, p[0-7]/z, \[x0, #2, mul vl\]\n} } } */
+/* { dg-final { scan-assembler {\tmov\tx1, sp\n} } } */
+/* { dg-final { scan-assembler {\tld2b\t{(z[0-9]+\.b) - z[0-9]+\.b}.*\tst1b\t\1, p[0-7], \[(?:x1|sp)\]\n} } } */
+/* { dg-final { scan-assembler {\tld2b\t{z[0-9]+\.b - (z[0-9]+\.b)}.*\tst1b\t\1, p[0-7], \[(?:x1|sp), #1, mul vl\]\n} } } */
+/* { dg-final { scan-assembler {\tptrue\tp0\.b, vl1\n} } } */
+/* { dg-final { scan-assembler {\tptrue\tp1\.h, vl2\n} } } */
+/* { dg-final { scan-assembler {\tptrue\tp2\.s, vl3\n} } } */
+/* { dg-final { scan-assembler {\tptrue\tp3\.d, vl4\n} } } */
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/pcs/args_5_le_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/pcs/args_5_le_mf8.c
new file mode 100644
index 00000000000..6106240e648
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/pcs/args_5_le_mf8.c
@@ -0,0 +1,58 @@
+/* { dg-do compile { target lp64 } } */
+/* { dg-options "-O -mlittle-endian -fno-stack-clash-protection -g" } */
+/* { dg-final { check-function-bodies "**" "" } } */
+
+#pragma GCC aarch64 "arm_sve.h"
+
+/*
+** callee:
+** (
+**	ldr	(z[0-9]+), \[x1, #1, mul vl\]
+**	ldr	(z[0-9]+), \[x1\]
+**	st2b	{\2\.b - \1\.b}, p0, \[x0\]
+** |
+**	ldr	(z[0-9]+), \[x1\]
+**	ldr	(z[0-9]+), \[x1, #1, mul vl\]
+**	st2b	{\3\.b - \4\.b}, p0, \[x0\]
+** )
+**	st4b	{z0\.b - z3\.b}, p1, \[x0\]
+**	st3b	{z4\.b - z6\.b}, p2, \[x0\]
+**	st1b	z7\.b, p3, \[x0\]
+**	ret
+*/
+void __attribute__((noipa))
+callee (void *x0, svmfloat8x4_t z0, svmfloat8x3_t z4, svmfloat8x2_t stack,
+	svmfloat8_t z7, svbool_t p0, svbool_t p1, svbool_t p2, svbool_t p3)
+{
+  svst2 (p0, x0, stack);
+  svst4 (p1, x0, z0);
+  svst3 (p2, x0, z4);
+  svst1_mf8 (p3, x0, z7);
+}
+
+void __attribute__((noipa))
+caller (void *x0)
+{
+  svbool_t pg;
+  pg = svptrue_b8 ();
+  callee (x0,
+	  svld4_vnum_mf8 (pg, x0, -8),
+	  svld3_vnum_mf8 (pg, x0, -3),
+	  svld2_vnum_mf8 (pg, x0, 0),
+	  svld1_vnum_mf8 (pg, x0, 2),
+	  svptrue_pat_b8 (SV_VL1),
+	  svptrue_pat_b16 (SV_VL2),
+	  svptrue_pat_b32 (SV_VL3),
+	  svptrue_pat_b64 (SV_VL4));
+}
+
+/* { dg-final { scan-assembler {\tld4b\t{z0\.b - z3\.b}, p[0-7]/z, \[x0, #-8, mul vl\]\n} } } */
+/* { dg-final { scan-assembler {\tld3b\t{z4\.b - z6\.b}, p[0-7]/z, \[x0, #-3, mul vl\]\n} } } */
+/* { dg-final { scan-assembler {\tld1b\tz7\.b, p[0-7]/z, \[x0, #2, mul vl\]\n} } } */
+/* { dg-final { scan-assembler {\tmov\tx1, sp\n} } } */
+/* { dg-final { scan-assembler {\tld2b\t{(z[0-9]+)\.b - z[0-9]+\.b}.*\tstr\t\1, \[(?:x1|sp)\]\n} } } */
+/* { dg-final { scan-assembler {\tld2b\t{z[0-9]+\.b - (z[0-9]+)\.b}.*\tstr\t\1, \[(?:x1|sp), #1, mul vl\]\n} } } */
+/* { dg-final { scan-assembler {\tptrue\tp0\.b, vl1\n} } } */
+/* { dg-final { scan-assembler {\tptrue\tp1\.h, vl2\n} } } */
+/* { dg-final { scan-assembler {\tptrue\tp2\.s, vl3\n} } } */
+/* { dg-final { scan-assembler {\tptrue\tp3\.d, vl4\n} } } */
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/pcs/args_6_be_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/pcs/args_6_be_mf8.c
new file mode 100644
index 00000000000..80af390b944
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/pcs/args_6_be_mf8.c
@@ -0,0 +1,71 @@
+/* { dg-do compile { target lp64 } } */
+/* { dg-options "-O -mbig-endian -fno-stack-clash-protection -fno-cprop-registers -fdisable-rtl-combine -g" } */
+/* { dg-final { check-function-bodies "**" "" } } */
+
+#pragma GCC aarch64 "arm_sve.h"
+
+/*
+** callee1:
+**	ptrue	p3\.b, all
+**	...
+**	ld1b	(z[0-9]+\.b), p3/z, \[x1, #3, mul vl\]
+**	...
+**	st4b	{z[0-9]+\.b - \1}, p0, \[x0\]
+**	st2b	{z3\.b - z4\.b}, p1, \[x0\]
+**	st3b	{z5\.b - z7\.b}, p2, \[x0\]
+**	ret
+*/
+void __attribute__((noipa))
+callee1 (void *x0, svmfloat8x3_t z0, svmfloat8x2_t z3, svmfloat8x3_t z5,
+	 svmfloat8x4_t stack1, svmfloat8_t stack2, svbool_t p0,
+	 svbool_t p1, svbool_t p2)
+{
+  svst4_mf8 (p0, x0, stack1);
+  svst2_mf8 (p1, x0, z3);
+  svst3_mf8 (p2, x0, z5);
+}
+
+/*
+** callee2:
+**	ptrue	p3\.b, all
+**	ld1b	(z[0-9]+\.b), p3/z, \[x2\]
+**	st1b	\1, p0, \[x0\]
+**	st2b	{z3\.b - z4\.b}, p1, \[x0\]
+**	st3b	{z0\.b - z2\.b}, p2, \[x0\]
+**	ret
+*/
+void __attribute__((noipa))
+callee2 (void *x0, svmfloat8x3_t z0, svmfloat8x2_t z3, svmfloat8x3_t z5,
+	 svmfloat8x4_t stack1, svmfloat8_t stack2, svbool_t p0,
+	 svbool_t p1, svbool_t p2)
+{
+  svst1_mf8 (p0, x0, stack2);
+  svst2_mf8 (p1, x0, z3);
+  svst3_mf8 (p2, x0, z0);
+}
+
+void __attribute__((noipa))
+caller (void *x0)
+{
+  svbool_t pg;
+  pg = svptrue_b8 ();
+  callee1 (x0,
+	   svld3_vnum_mf8 (pg, x0, -9),
+	   svld2_vnum_mf8 (pg, x0, -2),
+	   svld3_vnum_mf8 (pg, x0, 0),
+	   svld4_vnum_mf8 (pg, x0, 8),
+	   svld1_vnum_mf8 (pg, x0, 5),
+	   svptrue_pat_b8 (SV_VL1),
+	   svptrue_pat_b16 (SV_VL2),
+	   svptrue_pat_b32 (SV_VL3));
+}
+
+/* { dg-final { scan-assembler {\tld3b\t{z0\.b - z2\.b}, p[0-7]/z, \[x0, #-9, mul vl\]\n} } } */
+/* { dg-final { scan-assembler {\tld2b\t{z3\.b - z4\.b}, p[0-7]/z, \[x0, #-2, mul vl\]\n} } } */
+/* { dg-final { scan-assembler {\tld3b\t{z5\.b - z7\.b}, p[0-7]/z, \[x0\]\n} } } */
+/* { dg-final { scan-assembler {\tld4b\t{(z[0-9]+\.b) - z[0-9]+\.b}.*\tst1b\t\1, p[0-7], \[x1\]\n} } } */
+/* { dg-final { scan-assembler {\tld4b\t{z[0-9]+\.b - (z[0-9]+\.b)}.*\tst1b\t\1, p[0-7], \[x1, #3, mul vl\]\n} } } */
+/* { dg-final { scan-assembler {\tld1b\t(z[0-9]+\.b), p[0-7]/z, \[x0, #5, mul vl\]\n.*\tst1b\t\1, p[0-7], \[x2\]\n} } } */
+/* { dg-final { scan-assembler {\tptrue\tp0\.b, vl1\n} } } */
+/* { dg-final { scan-assembler {\tptrue\tp1\.h, vl2\n} } } */
+/* { dg-final { scan-assembler {\tptrue\tp2\.s, vl3\n} } } */
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/pcs/args_6_le_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/pcs/args_6_le_mf8.c
new file mode 100644
index 00000000000..e32089947c7
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/pcs/args_6_le_mf8.c
@@ -0,0 +1,70 @@
+/* { dg-do compile { target lp64 } } */
+/* { dg-options "-O -mlittle-endian -fno-stack-clash-protection -fno-cprop-registers -fdisable-rtl-combine -g" } */
+/* { dg-final { check-function-bodies "**" "" } } */
+
+#pragma GCC aarch64 "arm_sve.h"
+
+/*
+** callee1:
+**	...
+**	ldr	(z[0-9]+), \[x1, #3, mul vl\]
+**	...
+**	st4b	{z[0-9]+\.b - \1\.b}, p0, \[x0\]
+**	st2b	{z3\.b - z4\.b}, p1, \[x0\]
+**	st3b	{z5\.b - z7\.b}, p2, \[x0\]
+**	ret
+*/
+void __attribute__((noipa))
+callee1 (void *x0, svmfloat8x3_t z0, svmfloat8x2_t z3, svmfloat8x3_t z5,
+	 svmfloat8x4_t stack1, svmfloat8_t stack2, svbool_t p0,
+	 svbool_t p1, svbool_t p2)
+{
+  svst4_mf8 (p0, x0, stack1);
+  svst2_mf8 (p1, x0, z3);
+  svst3_mf8 (p2, x0, z5);
+}
+
+/*
+** callee2:
+**	ptrue	p3\.b, all
+**	ld1b	(z[0-9]+\.b), p3/z, \[x2\]
+**	st1b	\1, p0, \[x0\]
+**	st2b	{z3\.b - z4\.b}, p1, \[x0\]
+**	st3b	{z0\.b - z2\.b}, p2, \[x0\]
+**	ret
+*/
+void __attribute__((noipa))
+callee2 (void *x0, svmfloat8x3_t z0, svmfloat8x2_t z3, svmfloat8x3_t z5,
+	 svmfloat8x4_t stack1, svmfloat8_t stack2, svbool_t p0,
+	 svbool_t p1, svbool_t p2)
+{
+  svst1_mf8 (p0, x0, stack2);
+  svst2_mf8 (p1, x0, z3);
+  svst3_mf8 (p2, x0, z0);
+}
+
+void __attribute__((noipa))
+caller (void *x0)
+{
+  svbool_t pg;
+  pg = svptrue_b8 ();
+  callee1 (x0,
+	   svld3_vnum_mf8 (pg, x0, -9),
+	   svld2_vnum_mf8 (pg, x0, -2),
+	   svld3_vnum_mf8 (pg, x0, 0),
+	   svld4_vnum_mf8 (pg, x0, 8),
+	   svld1_vnum_mf8 (pg, x0, 5),
+	   svptrue_pat_b8 (SV_VL1),
+	   svptrue_pat_b16 (SV_VL2),
+	   svptrue_pat_b32 (SV_VL3));
+}
+
+/* { dg-final { scan-assembler {\tld3b\t{z0\.b - z2\.b}, p[0-7]/z, \[x0, #-9, mul vl\]\n} } } */
+/* { dg-final { scan-assembler {\tld2b\t{z3\.b - z4\.b}, p[0-7]/z, \[x0, #-2, mul vl\]\n} } } */
+/* { dg-final { scan-assembler {\tld3b\t{z5\.b - z7\.b}, p[0-7]/z, \[x0\]\n} } } */
+/* { dg-final { scan-assembler {\tld4b\t{(z[0-9]+)\.b - z[0-9]+\.b}.*\tstr\t\1, \[x1\]\n} } } */
+/* { dg-final { scan-assembler {\tld4b\t{z[0-9]+\.b - (z[0-9]+)\.b}.*\tstr\t\1, \[x1, #3, mul vl\]\n} } } */
+/* { dg-final { scan-assembler {\tld1b\t(z[0-9]+\.b), p[0-7]/z, \[x0, #5, mul vl\]\n.*\tst1b\t\1, p[0-7], \[x2\]\n} } } */
+/* { dg-final { scan-assembler {\tptrue\tp0\.b, vl1\n} } } */
+/* { dg-final { scan-assembler {\tptrue\tp1\.h, vl2\n} } } */
+/* { dg-final { scan-assembler {\tptrue\tp2\.s, vl3\n} } } */
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/pcs/gnu_vectors_1.c b/gcc/testsuite/gcc.target/aarch64/sve/pcs/gnu_vectors_1.c
index e5fceb14bbe..009a987fc31 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/pcs/gnu_vectors_1.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/pcs/gnu_vectors_1.c
@@ -2,6 +2,7 @@
 
 #include <arm_sve.h>
 
+typedef mfloat8_t mfloat8x32_t __attribute__((vector_size (32)));
 typedef bfloat16_t bfloat16x16_t __attribute__((vector_size (32)));
 typedef float16_t float16x16_t __attribute__((vector_size (32)));
 typedef float32_t float32x8_t __attribute__((vector_size (32)));
@@ -15,6 +16,7 @@ typedef uint16_t uint16x16_t __attribute__((vector_size (32)));
 typedef uint32_t uint32x8_t __attribute__((vector_size (32)));
 typedef uint64_t uint64x4_t __attribute__((vector_size (32)));
 
+void mfloat8_callee (mfloat8x32_t);
 void bfloat16_callee (bfloat16x16_t);
 void float16_callee (float16x16_t);
 void float32_callee (float32x8_t);
@@ -28,6 +30,12 @@ void uint16_callee (uint16x16_t);
 void uint32_callee (uint32x8_t);
 void uint64_callee (uint64x4_t);
 
+void
+mfloat8_caller (mfloat8_t val)
+{
+  mfloat8_callee (svdup_mf8 (val));
+}
+
 void
 bfloat16_caller (bfloat16_t val)
 {
@@ -100,8 +108,8 @@ uint64_caller (void)
   uint64_callee (svindex_u64 (1, 4));
 }
 
-/* { dg-final { scan-assembler-times {\tst1b\tz[0-9]+\.b, p[0-7], \[x0\]} 2 } } */
+/* { dg-final { scan-assembler-times {\tst1b\tz[0-9]+\.b, p[0-7], \[x0\]} 3 } } */
 /* { dg-final { scan-assembler-times {\tst1h\tz[0-9]+\.h, p[0-7], \[x0\]} 4 } } */
 /* { dg-final { scan-assembler-times {\tst1w\tz[0-9]+\.s, p[0-7], \[x0\]} 3 } } */
 /* { dg-final { scan-assembler-times {\tst1d\tz[0-9]+\.d, p[0-7], \[x0\]} 3 } } */
-/* { dg-final { scan-assembler-times {\tadd\tx0, sp, #?16\n} 12 } } */
+/* { dg-final { scan-assembler-times {\tadd\tx0, sp, #?16\n} 13 } } */
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/pcs/gnu_vectors_2.c b/gcc/testsuite/gcc.target/aarch64/sve/pcs/gnu_vectors_2.c
index 875567f0197..375ac16495a 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/pcs/gnu_vectors_2.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/pcs/gnu_vectors_2.c
@@ -2,6 +2,7 @@
 
 #include <arm_sve.h>
 
+typedef mfloat8_t mfloat8x32_t __attribute__((vector_size (32)));
 typedef bfloat16_t bfloat16x16_t __attribute__((vector_size (32)));
 typedef float16_t float16x16_t __attribute__((vector_size (32)));
 typedef float32_t float32x8_t __attribute__((vector_size (32)));
@@ -15,6 +16,7 @@ typedef uint16_t uint16x16_t __attribute__((vector_size (32)));
 typedef uint32_t uint32x8_t __attribute__((vector_size (32)));
 typedef uint64_t uint64x4_t __attribute__((vector_size (32)));
 
+void mfloat8_callee (svmfloat8_t);
 void bfloat16_callee (svbfloat16_t);
 void float16_callee (svfloat16_t);
 void float32_callee (svfloat32_t);
@@ -28,6 +30,12 @@ void uint16_callee (svuint16_t);
 void uint32_callee (svuint32_t);
 void uint64_callee (svuint64_t);
 
+void
+mfloat8_caller (mfloat8x32_t arg)
+{
+  mfloat8_callee (arg);
+}
+
 void
 bfloat16_caller (bfloat16x16_t arg)
 {
@@ -100,7 +108,7 @@ uint64_caller (uint64x4_t arg)
   uint64_callee (arg);
 }
 
-/* { dg-final { scan-assembler-times {\tld1b\tz0\.b, p[0-7]/z, \[x0\]} 2 } } */
+/* { dg-final { scan-assembler-times {\tld1b\tz0\.b, p[0-7]/z, \[x0\]} 3 } } */
 /* { dg-final { scan-assembler-times {\tld1h\tz0\.h, p[0-7]/z, \[x0\]} 4 } } */
 /* { dg-final { scan-assembler-times {\tld1w\tz0\.s, p[0-7]/z, \[x0\]} 3 } } */
 /* { dg-final { scan-assembler-times {\tld1d\tz0\.d, p[0-7]/z, \[x0\]} 3 } } */
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_4.c b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_4.c
index 91fdd3c202e..7fb4dcc3dad 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_4.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_4.c
@@ -25,6 +25,14 @@ CALLEE (s8, __SVInt8_t)
 */
 CALLEE (u8, __SVUint8_t)
 
+/*
+** callee_mf8:
+**	ptrue	(p[0-7])\.b, all
+**	ld1b	z0\.b, \1/z, \[x0\]
+**	ret
+*/
+CALLEE (mf8, __SVMfloat8_t)
+
 /*
 ** callee_s16:
 **	ptrue	(p[0-7])\.b, all
@@ -115,7 +123,7 @@ CALLEE (f64, __SVFloat64_t)
     return svaddv (svptrue_b8 (), callee_##SUFFIX (ptr1));	\
   }
 
-#define CALLER_BF16(SUFFIX, TYPE)				\
+#define CALLER_NON_NUMERIC(SUFFIX, TYPE)				\
   typeof (svlasta (svptrue_b8 (), *(TYPE *) 0))			\
   __attribute__((noipa))					\
   caller_##SUFFIX (TYPE *ptr1)					\
@@ -147,6 +155,15 @@ CALLER (s8, __SVInt8_t)
 */
 CALLER (u8, __SVUint8_t)
 
+/*
+** caller_mf8:
+**	...
+**	bl	callee_mf8
+**	ldp	x29, x30, \[sp\], 16
+**	ret
+*/
+CALLER_NON_NUMERIC (mf8, __SVMfloat8_t)
+
 /*
 ** caller_s16:
 **	...
@@ -189,7 +206,7 @@ CALLER (f16, __SVFloat16_t)
 **	ldp	x29, x30, \[sp\], 16
 **	ret
 */
-CALLER_BF16 (bf16, __SVBfloat16_t)
+CALLER_NON_NUMERIC (bf16, __SVBfloat16_t)
 
 /*
 ** caller_s32:
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_4_1024.c b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_4_1024.c
index 7d824caae1b..f3372eae7ed 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_4_1024.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_4_1024.c
@@ -25,6 +25,14 @@ CALLEE (s8, __SVInt8_t)
 */
 CALLEE (u8, __SVUint8_t)
 
+/*
+** callee_mf8:
+**	ptrue	(p[0-7])\.b, vl128
+**	ld1b	z0\.b, \1/z, \[x0\]
+**	ret
+*/
+CALLEE (mf8, __SVMfloat8_t)
+
 /*
 ** callee_s16:
 **	ptrue	(p[0-7])\.b, vl128
@@ -115,7 +123,7 @@ CALLEE (f64, __SVFloat64_t)
     return svaddv (svptrue_b8 (), callee_##SUFFIX (ptr1));	\
   }
 
-#define CALLER_BF16(SUFFIX, TYPE)				\
+#define CALLER_NON_NUMERIC(SUFFIX, TYPE)				\
   typeof (svlasta (svptrue_b8 (), *(TYPE *) 0))			\
   __attribute__((noipa))					\
   caller_##SUFFIX (TYPE *ptr1)					\
@@ -147,6 +155,15 @@ CALLER (s8, __SVInt8_t)
 */
 CALLER (u8, __SVUint8_t)
 
+/*
+** caller_mf8:
+**	...
+**	bl	callee_mf8
+**	ldp	x29, x30, \[sp\], 16
+**	ret
+*/
+CALLER_NON_NUMERIC (mf8, __SVMfloat8_t)
+
 /*
 ** caller_s16:
 **	...
@@ -189,7 +206,7 @@ CALLER (f16, __SVFloat16_t)
 **	ldp	x29, x30, \[sp\], 16
 **	ret
 */
-CALLER_BF16 (bf16, __SVBfloat16_t)
+CALLER_NON_NUMERIC (bf16, __SVBfloat16_t)
 
 /*
 ** caller_s32:
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_4_128.c b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_4_128.c
index e0aa3a5fa68..87d528c84cd 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_4_128.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_4_128.c
@@ -25,6 +25,14 @@ CALLEE (s8, __SVInt8_t)
 */
 CALLEE (u8, __SVUint8_t)
 
+/*
+** callee_mf8:
+**	ptrue	(p[0-7])\.b, vl16
+**	ld1b	z0\.b, \1/z, \[x0\]
+**	ret
+*/
+CALLEE (mf8, __SVMfloat8_t)
+
 /*
 ** callee_s16:
 **	ptrue	(p[0-7])\.b, vl16
@@ -115,7 +123,7 @@ CALLEE (f64, __SVFloat64_t)
     return svaddv (svptrue_b8 (), callee_##SUFFIX (ptr1));	\
   }
 
-#define CALLER_BF16(SUFFIX, TYPE)				\
+#define CALLER_NON_NUMERIC(SUFFIX, TYPE)				\
   typeof (svlasta (svptrue_b8 (), *(TYPE *) 0))			\
   __attribute__((noipa))					\
   caller_##SUFFIX (TYPE *ptr1)					\
@@ -147,6 +155,15 @@ CALLER (s8, __SVInt8_t)
 */
 CALLER (u8, __SVUint8_t)
 
+/*
+** caller_mf8:
+**	...
+**	bl	callee_mf8
+**	ldp	x29, x30, \[sp\], 16
+**	ret
+*/
+CALLER_NON_NUMERIC (mf8, __SVMfloat8_t)
+
 /*
 ** caller_s16:
 **	...
@@ -189,7 +206,7 @@ CALLER (f16, __SVFloat16_t)
 **	ldp	x29, x30, \[sp\], 16
 **	ret
 */
-CALLER_BF16 (bf16, __SVBfloat16_t)
+CALLER_NON_NUMERIC (bf16, __SVBfloat16_t)
 
 /*
 ** caller_s32:
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_4_2048.c b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_4_2048.c
index 3238015d9eb..4b429293dca 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_4_2048.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_4_2048.c
@@ -25,6 +25,14 @@ CALLEE (s8, __SVInt8_t)
 */
 CALLEE (u8, __SVUint8_t)
 
+/*
+** callee_mf8:
+**	ptrue	(p[0-7])\.b, vl256
+**	ld1b	z0\.b, \1/z, \[x0\]
+**	ret
+*/
+CALLEE (mf8, __SVMfloat8_t)
+
 /*
 ** callee_s16:
 **	ptrue	(p[0-7])\.b, vl256
@@ -115,7 +123,7 @@ CALLEE (f64, __SVFloat64_t)
     return svaddv (svptrue_b8 (), callee_##SUFFIX (ptr1));	\
   }
 
-#define CALLER_BF16(SUFFIX, TYPE)				\
+#define CALLER_NON_NUMERIC(SUFFIX, TYPE)				\
   typeof (svlasta (svptrue_b8 (), *(TYPE *) 0))			\
   __attribute__((noipa))					\
   caller_##SUFFIX (TYPE *ptr1)					\
@@ -147,6 +155,15 @@ CALLER (s8, __SVInt8_t)
 */
 CALLER (u8, __SVUint8_t)
 
+/*
+** caller_mf8:
+**	...
+**	bl	callee_mf8
+**	ldp	x29, x30, \[sp\], 16
+**	ret
+*/
+CALLER_NON_NUMERIC (mf8, __SVMfloat8_t)
+
 /*
 ** caller_s16:
 **	...
@@ -189,7 +206,7 @@ CALLER (f16, __SVFloat16_t)
 **	ldp	x29, x30, \[sp\], 16
 **	ret
 */
-CALLER_BF16 (bf16, __SVBfloat16_t)
+CALLER_NON_NUMERIC (bf16, __SVBfloat16_t)
 
 /*
 ** caller_s32:
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_4_256.c b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_4_256.c
index 50861098934..f90181a9829 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_4_256.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_4_256.c
@@ -25,6 +25,14 @@ CALLEE (s8, __SVInt8_t)
 */
 CALLEE (u8, __SVUint8_t)
 
+/*
+** callee_mf8:
+**	ptrue	(p[0-7])\.b, vl32
+**	ld1b	z0\.b, \1/z, \[x0\]
+**	ret
+*/
+CALLEE (mf8, __SVMfloat8_t)
+
 /*
 ** callee_s16:
 **	ptrue	(p[0-7])\.b, vl32
@@ -115,7 +123,7 @@ CALLEE (f64, __SVFloat64_t)
     return svaddv (svptrue_b8 (), callee_##SUFFIX (ptr1));	\
   }
 
-#define CALLER_BF16(SUFFIX, TYPE)				\
+#define CALLER_NON_NUMERIC(SUFFIX, TYPE)				\
   typeof (svlasta (svptrue_b8 (), *(TYPE *) 0))			\
   __attribute__((noipa))					\
   caller_##SUFFIX (TYPE *ptr1)					\
@@ -147,6 +155,15 @@ CALLER (s8, __SVInt8_t)
 */
 CALLER (u8, __SVUint8_t)
 
+/*
+** caller_mf8:
+**	...
+**	bl	callee_mf8
+**	ldp	x29, x30, \[sp\], 16
+**	ret
+*/
+CALLER_NON_NUMERIC (mf8, __SVMfloat8_t)
+
 /*
 ** caller_s16:
 **	...
@@ -189,7 +206,7 @@ CALLER (f16, __SVFloat16_t)
 **	ldp	x29, x30, \[sp\], 16
 **	ret
 */
-CALLER_BF16 (bf16, __SVBfloat16_t)
+CALLER_NON_NUMERIC (bf16, __SVBfloat16_t)
 
 /*
 ** caller_s32:
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_4_512.c b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_4_512.c
index 300dacce955..c3ae7acd5a5 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_4_512.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_4_512.c
@@ -25,6 +25,14 @@ CALLEE (s8, __SVInt8_t)
 */
 CALLEE (u8, __SVUint8_t)
 
+/*
+** callee_mf8:
+**	ptrue	(p[0-7])\.b, vl64
+**	ld1b	z0\.b, \1/z, \[x0\]
+**	ret
+*/
+CALLEE (mf8, __SVMfloat8_t)
+
 /*
 ** callee_s16:
 **	ptrue	(p[0-7])\.b, vl64
@@ -115,7 +123,7 @@ CALLEE (f64, __SVFloat64_t)
     return svaddv (svptrue_b8 (), callee_##SUFFIX (ptr1));	\
   }
 
-#define CALLER_BF16(SUFFIX, TYPE)				\
+#define CALLER_NON_NUMERIC(SUFFIX, TYPE)				\
   typeof (svlasta (svptrue_b8 (), *(TYPE *) 0))			\
   __attribute__((noipa))					\
   caller_##SUFFIX (TYPE *ptr1)					\
@@ -147,6 +155,15 @@ CALLER (s8, __SVInt8_t)
 */
 CALLER (u8, __SVUint8_t)
 
+/*
+** caller_mf8:
+**	...
+**	bl	callee_mf8
+**	ldp	x29, x30, \[sp\], 16
+**	ret
+*/
+CALLER_NON_NUMERIC (mf8, __SVMfloat8_t)
+
 /*
 ** caller_s16:
 **	...
@@ -189,7 +206,7 @@ CALLER (f16, __SVFloat16_t)
 **	ldp	x29, x30, \[sp\], 16
 **	ret
 */
-CALLER_BF16 (bf16, __SVBfloat16_t)
+CALLER_NON_NUMERIC (bf16, __SVBfloat16_t)
 
 /*
 ** caller_s32:
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_5.c b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_5.c
index 0a840a38384..e1b941e8f5e 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_5.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_5.c
@@ -27,6 +27,14 @@ CALLEE (s8, svint8_t)
 */
 CALLEE (u8, svuint8_t)
 
+/*
+** callee_mf8:
+**	ptrue	(p[0-7])\.b, all
+**	ld1b	z0\.b, \1/z, \[x0\]
+**	ret
+*/
+CALLEE (mf8, svmfloat8_t)
+
 /*
 ** callee_s16:
 **	ptrue	(p[0-7])\.b, all
@@ -115,7 +123,7 @@ CALLEE (f64, svfloat64_t)
     return svaddv (svptrue_b8 (), callee_##SUFFIX (ptr1));	\
   }
 
-#define CALLER_BF16(SUFFIX, TYPE)				\
+#define CALLER_NON_NUMERIC(SUFFIX, TYPE)				\
   typeof (svlasta (svptrue_b8 (), *(TYPE *) 0))			\
   __attribute__((noipa))					\
   caller_##SUFFIX (TYPE *ptr1)					\
@@ -147,6 +155,15 @@ CALLER (s8, svint8_t)
 */
 CALLER (u8, svuint8_t)
 
+/*
+** caller_mf8:
+**	...
+**	bl	callee_mf8
+**	ldp	x29, x30, \[sp\], 16
+**	ret
+*/
+CALLER_NON_NUMERIC (mf8, svmfloat8_t)
+
 /*
 ** caller_s16:
 **	...
@@ -189,7 +206,7 @@ CALLER (f16, svfloat16_t)
 **	ldp	x29, x30, \[sp\], 16
 **	ret
 */
-CALLER_BF16 (bf16, svbfloat16_t)
+CALLER_NON_NUMERIC (bf16, svbfloat16_t)
 
 /*
 ** caller_s32:
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_5_1024.c b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_5_1024.c
index 18cefbff1e6..d621b0c40c8 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_5_1024.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_5_1024.c
@@ -27,6 +27,14 @@ CALLEE (s8, svint8_t)
 */
 CALLEE (u8, svuint8_t)
 
+/*
+** callee_mf8:
+**	ptrue	(p[0-7])\.b, vl128
+**	ld1b	z0\.b, \1/z, \[x0\]
+**	ret
+*/
+CALLEE (mf8, svmfloat8_t)
+
 /*
 ** callee_s16:
 **	ptrue	(p[0-7])\.b, vl128
@@ -115,7 +123,7 @@ CALLEE (f64, svfloat64_t)
     return svaddv (svptrue_b8 (), callee_##SUFFIX (ptr1));	\
   }
 
-#define CALLER_BF16(SUFFIX, TYPE)				\
+#define CALLER_NON_NUMERIC(SUFFIX, TYPE)				\
   typeof (svlasta (svptrue_b8 (), *(TYPE *) 0))			\
   __attribute__((noipa))					\
   caller_##SUFFIX (TYPE *ptr1)					\
@@ -147,6 +155,15 @@ CALLER (s8, svint8_t)
 */
 CALLER (u8, svuint8_t)
 
+/*
+** caller_mf8:
+**	...
+**	bl	callee_mf8
+**	ldp	x29, x30, \[sp\], 16
+**	ret
+*/
+CALLER_NON_NUMERIC (mf8, svmfloat8_t)
+
 /*
 ** caller_s16:
 **	...
@@ -189,7 +206,7 @@ CALLER (f16, svfloat16_t)
 **	ldp	x29, x30, \[sp\], 16
 **	ret
 */
-CALLER_BF16 (bf16, svbfloat16_t)
+CALLER_NON_NUMERIC (bf16, svbfloat16_t)
 
 /*
 ** caller_s32:
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_5_128.c b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_5_128.c
index c622ed55674..347a16c1367 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_5_128.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_5_128.c
@@ -27,6 +27,14 @@ CALLEE (s8, svint8_t)
 */
 CALLEE (u8, svuint8_t)
 
+/*
+** callee_mf8:
+**	ptrue	(p[0-7])\.b, vl16
+**	ld1b	z0\.b, \1/z, \[x0\]
+**	ret
+*/
+CALLEE (mf8, svmfloat8_t)
+
 /*
 ** callee_s16:
 **	ptrue	(p[0-7])\.b, vl16
@@ -115,7 +123,7 @@ CALLEE (f64, svfloat64_t)
     return svaddv (svptrue_b8 (), callee_##SUFFIX (ptr1));	\
   }
 
-#define CALLER_BF16(SUFFIX, TYPE)				\
+#define CALLER_NON_NUMERIC(SUFFIX, TYPE)				\
   typeof (svlasta (svptrue_b8 (), *(TYPE *) 0))			\
   __attribute__((noipa))					\
   caller_##SUFFIX (TYPE *ptr1)					\
@@ -147,6 +155,15 @@ CALLER (s8, svint8_t)
 */
 CALLER (u8, svuint8_t)
 
+/*
+** caller_mf8:
+**	...
+**	bl	callee_mf8
+**	ldp	x29, x30, \[sp\], 16
+**	ret
+*/
+CALLER_NON_NUMERIC (mf8, svmfloat8_t)
+
 /*
 ** caller_s16:
 **	...
@@ -189,7 +206,7 @@ CALLER (f16, svfloat16_t)
 **	ldp	x29, x30, \[sp\], 16
 **	ret
 */
-CALLER_BF16 (bf16, svbfloat16_t)
+CALLER_NON_NUMERIC (bf16, svbfloat16_t)
 
 /*
 ** caller_s32:
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_5_2048.c b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_5_2048.c
index 3286280687d..cb369842ff0 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_5_2048.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_5_2048.c
@@ -27,6 +27,14 @@ CALLEE (s8, svint8_t)
 */
 CALLEE (u8, svuint8_t)
 
+/*
+** callee_mf8:
+**	ptrue	(p[0-7])\.b, vl256
+**	ld1b	z0\.b, \1/z, \[x0\]
+**	ret
+*/
+CALLEE (mf8, svmfloat8_t)
+
 /*
 ** callee_s16:
 **	ptrue	(p[0-7])\.b, vl256
@@ -115,7 +123,7 @@ CALLEE (f64, svfloat64_t)
     return svaddv (svptrue_b8 (), callee_##SUFFIX (ptr1));	\
   }
 
-#define CALLER_BF16(SUFFIX, TYPE)				\
+#define CALLER_NON_NUMERIC(SUFFIX, TYPE)				\
   typeof (svlasta (svptrue_b8 (), *(TYPE *) 0))			\
   __attribute__((noipa))					\
   caller_##SUFFIX (TYPE *ptr1)					\
@@ -147,6 +155,15 @@ CALLER (s8, svint8_t)
 */
 CALLER (u8, svuint8_t)
 
+/*
+** caller_mf8:
+**	...
+**	bl	callee_mf8
+**	ldp	x29, x30, \[sp\], 16
+**	ret
+*/
+CALLER_NON_NUMERIC (mf8, svmfloat8_t)
+
 /*
 ** caller_s16:
 **	...
@@ -189,7 +206,7 @@ CALLER (f16, svfloat16_t)
 **	ldp	x29, x30, \[sp\], 16
 **	ret
 */
-CALLER_BF16 (bf16, svbfloat16_t)
+CALLER_NON_NUMERIC (bf16, svbfloat16_t)
 
 /*
 ** caller_s32:
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_5_256.c b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_5_256.c
index 3c6afa2fdf1..959a698f970 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_5_256.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_5_256.c
@@ -27,6 +27,14 @@ CALLEE (s8, svint8_t)
 */
 CALLEE (u8, svuint8_t)
 
+/*
+** callee_mf8:
+**	ptrue	(p[0-7])\.b, vl32
+**	ld1b	z0\.b, \1/z, \[x0\]
+**	ret
+*/
+CALLEE (mf8, svmfloat8_t)
+
 /*
 ** callee_s16:
 **	ptrue	(p[0-7])\.b, vl32
@@ -115,7 +123,7 @@ CALLEE (f64, svfloat64_t)
     return svaddv (svptrue_b8 (), callee_##SUFFIX (ptr1));	\
   }
 
-#define CALLER_BF16(SUFFIX, TYPE)				\
+#define CALLER_NON_NUMERIC(SUFFIX, TYPE)				\
   typeof (svlasta (svptrue_b8 (), *(TYPE *) 0))			\
   __attribute__((noipa))					\
   caller_##SUFFIX (TYPE *ptr1)					\
@@ -147,6 +155,15 @@ CALLER (s8, svint8_t)
 */
 CALLER (u8, svuint8_t)
 
+/*
+** caller_mf8:
+**	...
+**	bl	callee_mf8
+**	ldp	x29, x30, \[sp\], 16
+**	ret
+*/
+CALLER_NON_NUMERIC (mf8, svmfloat8_t)
+
 /*
 ** caller_s16:
 **	...
@@ -189,7 +206,7 @@ CALLER (f16, svfloat16_t)
 **	ldp	x29, x30, \[sp\], 16
 **	ret
 */
-CALLER_BF16 (bf16, svbfloat16_t)
+CALLER_NON_NUMERIC (bf16, svbfloat16_t)
 
 /*
 ** caller_s32:
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_5_512.c b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_5_512.c
index bb7d3ebf9d4..9e40821de3c 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_5_512.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_5_512.c
@@ -27,6 +27,14 @@ CALLEE (s8, svint8_t)
 */
 CALLEE (u8, svuint8_t)
 
+/*
+** callee_mf8:
+**	ptrue	(p[0-7])\.b, vl64
+**	ld1b	z0\.b, \1/z, \[x0\]
+**	ret
+*/
+CALLEE (mf8, svmfloat8_t)
+
 /*
 ** callee_s16:
 **	ptrue	(p[0-7])\.b, vl64
@@ -115,7 +123,7 @@ CALLEE (f64, svfloat64_t)
     return svaddv (svptrue_b8 (), callee_##SUFFIX (ptr1));	\
   }
 
-#define CALLER_BF16(SUFFIX, TYPE)				\
+#define CALLER_NON_NUMERIC(SUFFIX, TYPE)				\
   typeof (svlasta (svptrue_b8 (), *(TYPE *) 0))			\
   __attribute__((noipa))					\
   caller_##SUFFIX (TYPE *ptr1)					\
@@ -147,6 +155,15 @@ CALLER (s8, svint8_t)
 */
 CALLER (u8, svuint8_t)
 
+/*
+** caller_mf8:
+**	...
+**	bl	callee_mf8
+**	ldp	x29, x30, \[sp\], 16
+**	ret
+*/
+CALLER_NON_NUMERIC (mf8, svmfloat8_t)
+
 /*
 ** caller_s16:
 **	...
@@ -189,7 +206,7 @@ CALLER (f16, svfloat16_t)
 **	ldp	x29, x30, \[sp\], 16
 **	ret
 */
-CALLER_BF16 (bf16, svbfloat16_t)
+CALLER_NON_NUMERIC (bf16, svbfloat16_t)
 
 /*
 ** caller_s32:
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_6.c b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_6.c
index 1bc2f43bcf9..81c0a4163fa 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_6.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_6.c
@@ -6,6 +6,7 @@
 
 typedef int8_t svint8_t __attribute__ ((vector_size (32)));
 typedef uint8_t svuint8_t __attribute__ ((vector_size (32)));
+typedef __mfp8 svmfloat8_t __attribute__ ((vector_size (32)));
 
 typedef int16_t svint16_t __attribute__ ((vector_size (32)));
 typedef uint16_t svuint16_t __attribute__ ((vector_size (32)));
@@ -53,6 +54,19 @@ CALLEE (s8, svint8_t)
 */
 CALLEE (u8, svuint8_t)
 
+/*
+** callee_u8:
+** (
+**	ld1	({v.*}), \[x0\]
+**	st1	\1, \[x8\]
+** |
+**	ldp	(q[0-9]+, q[0-9]+), \[x0\]
+**	stp	\2, \[x8\]
+** )
+**	ret
+*/
+CALLEE (mf8, svmfloat8_t)
+
 /*
 ** callee_s16:
 ** (
@@ -171,6 +185,16 @@ CALLER (s8, svint8_t)
 */
 CALLER (u8, svuint8_t)
 
+/*
+** caller_mf8:
+**	...
+**	bl	callee_mf8
+**	ldr	b0, \[sp, 16\]
+**	ldp	x29, x30, \[sp\], 48
+**	ret
+*/
+CALLER (mf8, svmfloat8_t)
+
 /*
 ** caller_s16:
 **	...
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_6_1024.c b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_6_1024.c
index 6c716ef7c34..6b58dd48eab 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_6_1024.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_6_1024.c
@@ -6,6 +6,7 @@
 
 typedef int8_t svint8_t __attribute__ ((vector_size (128)));
 typedef uint8_t svuint8_t __attribute__ ((vector_size (128)));
+typedef __mfp8 svmfloat8_t __attribute__ ((vector_size (128)));
 
 typedef int16_t svint16_t __attribute__ ((vector_size (128)));
 typedef uint16_t svuint16_t __attribute__ ((vector_size (128)));
@@ -45,6 +46,15 @@ CALLEE (s8, svint8_t)
 */
 CALLEE (u8, svuint8_t)
 
+/*
+** callee_mf8:
+**	ptrue	(p[0-7])\.b, vl128
+**	ld1b	(z[0-9]+)\.b, \1/z, \[x0\]
+**	st1b	\2\.b, \1, \[x8\]
+**	ret
+*/
+CALLEE (mf8, svmfloat8_t)
+
 /*
 ** callee_s16:
 **	ptrue	(p[0-7])\.b, vl128
@@ -166,6 +176,18 @@ CALLER (s8, svint8_t)
 */
 CALLER (u8, svuint8_t)
 
+/*
+** caller_mf8:
+**	...
+**	bl	callee_mf8
+**	...
+**	ld1b	(z[0-9]+\.b), (p[0-7])/z, \[[^]]*\]
+**	st1b	\1, \2, \[[^]]*\]
+**	...
+**	ret
+*/
+CALLER (mf8, svmfloat8_t)
+
 /*
 ** caller_s16:
 **	...
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_6_128.c b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_6_128.c
index 4f190fd1444..18ace1985fe 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_6_128.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_6_128.c
@@ -6,6 +6,7 @@
 
 typedef int8_t svint8_t __attribute__ ((vector_size (16)));
 typedef uint8_t svuint8_t __attribute__ ((vector_size (16)));
+typedef __mfp8 svmfloat8_t __attribute__ ((vector_size (16)));
 
 typedef int16_t svint16_t __attribute__ ((vector_size (16)));
 typedef uint16_t svuint16_t __attribute__ ((vector_size (16)));
@@ -41,6 +42,13 @@ CALLEE (s8, svint8_t)
 */
 CALLEE (u8, svuint8_t)
 
+/*
+** callee_mf8:
+**	ldr	q0, \[x0\]
+**	ret
+*/
+CALLEE (mf8, svmfloat8_t)
+
 /*
 ** callee_s16:
 **	ldr	q0, \[x0\]
@@ -140,6 +148,17 @@ CALLER (s8, svint8_t)
 */
 CALLER (u8, svuint8_t)
 
+/*
+** caller_mf8:
+**	...
+**	bl	callee_mf8
+**	...
+**	str	q0, \[[^]]*\]
+**	...
+**	ret
+*/
+CALLER (mf8, svmfloat8_t)
+
 /*
 ** caller_s16:
 **	...
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_6_2048.c b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_6_2048.c
index 0eb9607d9db..0def3b5f2da 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_6_2048.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_6_2048.c
@@ -6,6 +6,7 @@
 
 typedef int8_t svint8_t __attribute__ ((vector_size (256)));
 typedef uint8_t svuint8_t __attribute__ ((vector_size (256)));
+typedef __mfp8 svmfloat8_t __attribute__ ((vector_size (256)));
 
 typedef int16_t svint16_t __attribute__ ((vector_size (256)));
 typedef uint16_t svuint16_t __attribute__ ((vector_size (256)));
@@ -45,6 +46,15 @@ CALLEE (s8, svint8_t)
 */
 CALLEE (u8, svuint8_t)
 
+/*
+** callee_mf8:
+**	ptrue	(p[0-7])\.b, vl256
+**	ld1b	(z[0-9]+)\.b, \1/z, \[x0\]
+**	st1b	\2\.b, \1, \[x8\]
+**	ret
+*/
+CALLEE (mf8, svmfloat8_t)
+
 /*
 ** callee_s16:
 **	ptrue	(p[0-7])\.b, vl256
@@ -166,6 +176,18 @@ CALLER (s8, svint8_t)
 */
 CALLER (u8, svuint8_t)
 
+/*
+** caller_mf8:
+**	...
+**	bl	callee_mf8
+**	...
+**	ld1b	(z[0-9]+\.b), (p[0-7])/z, \[[^]]*\]
+**	st1b	\1, \2, \[[^]]*\]
+**	...
+**	ret
+*/
+CALLER (mf8, svmfloat8_t)
+
 /*
 ** caller_s16:
 **	...
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_6_256.c b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_6_256.c
index 749eb332599..17055521f7d 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_6_256.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_6_256.c
@@ -6,6 +6,7 @@
 
 typedef int8_t svint8_t __attribute__ ((vector_size (32)));
 typedef uint8_t svuint8_t __attribute__ ((vector_size (32)));
+typedef __mfp8 svmfloat8_t __attribute__ ((vector_size (32)));
 
 typedef int16_t svint16_t __attribute__ ((vector_size (32)));
 typedef uint16_t svuint16_t __attribute__ ((vector_size (32)));
@@ -45,6 +46,15 @@ CALLEE (s8, svint8_t)
 */
 CALLEE (u8, svuint8_t)
 
+/*
+** callee_mf8:
+**	ptrue	(p[0-7])\.b, vl32
+**	ld1b	(z[0-9]+)\.b, \1/z, \[x0\]
+**	st1b	\2\.b, \1, \[x8\]
+**	ret
+*/
+CALLEE (mf8, svmfloat8_t)
+
 /*
 ** callee_s16:
 **	ptrue	(p[0-7])\.b, vl32
@@ -166,6 +176,18 @@ CALLER (s8, svint8_t)
 */
 CALLER (u8, svuint8_t)
 
+/*
+** caller_mf8:
+**	...
+**	bl	callee_mf8
+**	...
+**	ld1b	(z[0-9]+\.b), (p[0-7])/z, \[[^]]*\]
+**	st1b	\1, \2, \[[^]]*\]
+**	...
+**	ret
+*/
+CALLER (mf8, svmfloat8_t)
+
 /*
 ** caller_s16:
 **	...
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_6_512.c b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_6_512.c
index f6a64cc4944..324d0973ece 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_6_512.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_6_512.c
@@ -6,6 +6,7 @@
 
 typedef int8_t svint8_t __attribute__ ((vector_size (64)));
 typedef uint8_t svuint8_t __attribute__ ((vector_size (64)));
+typedef __mfp8 svmfloat8_t __attribute__ ((vector_size (64)));
 
 typedef int16_t svint16_t __attribute__ ((vector_size (64)));
 typedef uint16_t svuint16_t __attribute__ ((vector_size (64)));
@@ -45,6 +46,15 @@ CALLEE (s8, svint8_t)
 */
 CALLEE (u8, svuint8_t)
 
+/*
+** callee_mf8:
+**	ptrue	(p[0-7])\.b, vl64
+**	ld1b	(z[0-9]+)\.b, \1/z, \[x0\]
+**	st1b	\2\.b, \1, \[x8\]
+**	ret
+*/
+CALLEE (mf8, svmfloat8_t)
+
 /*
 ** callee_s16:
 **	ptrue	(p[0-7])\.b, vl64
@@ -166,6 +176,18 @@ CALLER (s8, svint8_t)
 */
 CALLER (u8, svuint8_t)
 
+/*
+** caller_mf8:
+**	...
+**	bl	callee_mf8
+**	...
+**	ld1b	(z[0-9]+\.b), (p[0-7])/z, \[[^]]*\]
+**	st1b	\1, \2, \[[^]]*\]
+**	...
+**	ret
+*/
+CALLER (mf8, svmfloat8_t)
+
 /*
 ** caller_s16:
 **	...
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_7.c b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_7.c
index 55456a3b4cb..5d1d4595259 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_7.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_7.c
@@ -60,6 +60,34 @@ caller_u8 (void)
   return svtrn2 (svget2 (res, 1), svget2 (res, 0));
 }
 
+/*
+** callee_mf8:
+**	mov	z0\.b, b2
+**	mov	z1\.b, b3
+**	ret
+*/
+svmfloat8x2_t __attribute__((noipa))
+callee_mf8 (mfloat8_t h0, mfloat8_t h1, mfloat8_t h2, mfloat8_t h3)
+{
+  return svcreate2 (svdup_mf8 (h2), svdup_mf8 (h3));
+}
+
+/*
+** caller_mf8:
+**	...
+**	bl	callee_mf8
+**	trn2	z0\.b, z1\.b, z0\.b
+**	ldp	x29, x30, \[sp\], 16
+**	ret
+*/
+svmfloat8_t __attribute__((noipa))
+caller_mf8 (mfloat8_t h0, mfloat8_t h1, mfloat8_t h2, mfloat8_t h3)
+{
+  svmfloat8x2_t res;
+  res = callee_mf8 (h0, h1, h2, h3);
+  return svtrn2 (svget2 (res, 1), svget2 (res, 0));
+}
+
 /*
 ** callee_s16:
 **	mov	z0\.h, #1
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_8.c b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_8.c
index 9581811e7f3..05373029fe5 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_8.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_8.c
@@ -66,6 +66,35 @@ caller_u8 (void)
 		  svget3 (res, 0), svget3 (res, 1), svget3 (res, 2));
 }
 
+/*
+** callee_mf8:
+**	mov	z0\.b, b0
+**	mov	z1\.b, b1
+**	mov	z2\.b, b2
+**	ret
+*/
+svmfloat8x3_t __attribute__((noipa))
+callee_mf8 (mfloat8_t h0, mfloat8_t h1, mfloat8_t h2)
+{
+  return svcreate3 (svdup_mf8 (h0), svdup_mf8 (h1), svdup_mf8 (h2));
+}
+
+/*
+** caller_mf8:
+**	...
+**	bl	callee_mf8
+**	trn2	z0\.b, z0\.b, z2\.b
+**	ldp	x29, x30, \[sp\], 16
+**	ret
+*/
+svmfloat8_t __attribute__((noipa))
+caller_mf8 (mfloat8_t h0, mfloat8_t h1, mfloat8_t h2)
+{
+  svmfloat8x3_t res;
+  res = callee_mf8 (h0, h1, h2);
+  return svtrn2 (svget3 (res, 0), svget3 (res, 2));
+}
+
 /*
 ** callee_s16:
 **	mov	z0\.h, #1
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_9.c b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_9.c
index 3b2604e6068..4133709dd2b 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_9.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/pcs/return_9.c
@@ -74,6 +74,39 @@ caller_u8 (void)
 			   svget4 (res, 3)));
 }
 
+/*
+** callee_mf8:
+**	mov	z0\.b, b4
+**	mov	z1\.b, b5
+**	mov	z2\.b, b6
+**	mov	z3\.b, b7
+**	ret
+*/
+svmfloat8x4_t __attribute__((noipa))
+callee_mf8 (mfloat8_t h0, mfloat8_t h1, mfloat8_t h2, mfloat8_t h3,
+	     mfloat8_t h4, mfloat8_t h5, mfloat8_t h6, mfloat8_t h7)
+{
+  return svcreate4 (svdup_mf8 (h4), svdup_mf8 (h5),
+		    svdup_mf8 (h6), svdup_mf8 (h7));
+}
+
+/*
+** caller_mf8:
+**	...
+**	bl	callee_mf8
+**	trn2	z0\.b, z0\.b, z3\.b
+**	ldp	x29, x30, \[sp\], 16
+**	ret
+*/
+svmfloat8_t __attribute__((noipa))
+caller_mf8 (mfloat8_t h0, mfloat8_t h1, mfloat8_t h2, mfloat8_t h3,
+	     mfloat8_t h4, mfloat8_t h5, mfloat8_t h6, mfloat8_t h7)
+{
+  svmfloat8x4_t res;
+  res = callee_mf8 (h0, h1, h2, h3, h4, h5, h6, h7);
+  return svtrn2 (svget4 (res, 0), svget4 (res, 3));
+}
+
 /*
 ** callee_s16:
 **	mov	z0\.h, #1
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/pcs/varargs_2_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve/pcs/varargs_2_mf8.c
new file mode 100644
index 00000000000..2c1da70c9ee
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/pcs/varargs_2_mf8.c
@@ -0,0 +1,170 @@
+/* { dg-do compile } */
+/* { dg-options "-O2 -fno-stack-clash-protection -fno-cprop-registers -fdisable-rtl-combine -g" } */
+/* { dg-final { check-function-bodies "**" "" "" { target lp64 } } } */
+
+#include <arm_sve.h>
+#include <stdarg.h>
+
+/*
+** callee_0:
+**	...
+**	ld1b	(z[0-9]+\.b), (p[0-7])/z, \[x1\]
+**	...
+**	st1b	\1, \2, \[x0\]
+**	...
+**	ret
+*/
+void __attribute__((noipa))
+callee_0 (mfloat8_t *ptr, ...)
+{
+  va_list va;
+  svmfloat8_t vec;
+
+  va_start (va, ptr);
+  vec = va_arg (va, svmfloat8_t);
+  va_end (va);
+  svst1 (svptrue_b8 (), ptr, vec);
+}
+
+/*
+** caller_0:
+**	...
+**	mov	(z[0-9]+\.b), w2
+**	...
+**	st1b	\1, p[0-7], \[x1\]
+**	...
+**	ret
+*/
+void __attribute__((noipa))
+caller_0 (mfloat8_t *ptr, mfloat8_t in)
+{
+  callee_0 (ptr, svdup_mf8 (in));
+}
+
+/*
+** callee_1:
+**	...
+**	ld1b	(z[0-9]+\.b), (p[0-7])/z, \[x2\]
+**	...
+**	st1b	\1, p[0-7], \[x0\]
+**	...
+**	ret
+*/
+void __attribute__((noipa))
+callee_1 (mfloat8_t *ptr, ...)
+{
+  va_list va;
+  svmfloat8_t vec;
+
+  va_start (va, ptr);
+  va_arg (va, int);
+  vec = va_arg (va, svmfloat8_t);
+  va_end (va);
+  svst1 (svptrue_b8 (), ptr, vec);
+}
+
+/*
+** caller_1:
+**	...
+**	mov	(z[0-9]+\.b), w3
+**	...
+**	st1b	\1, p[0-7], \[x2\]
+**	...
+**	ret
+*/
+void __attribute__((noipa))
+caller_1 (mfloat8_t *ptr, mfloat8_t in)
+{
+  callee_1 (ptr, 1, svdup_mf8 (in));
+}
+
+/*
+** callee_7:
+**	...
+**	ld1b	(z[0-9]+\.b), (p[0-7])/z, \[x7\]
+**	...
+**	st1b	\1, p[0-7], \[x0\]
+**	...
+**	ret
+*/
+void __attribute__((noipa))
+callee_7 (mfloat8_t *ptr, ...)
+{
+  va_list va;
+  svmfloat8_t vec;
+
+  va_start (va, ptr);
+  va_arg (va, int);
+  va_arg (va, int);
+  va_arg (va, int);
+  va_arg (va, int);
+  va_arg (va, int);
+  va_arg (va, int);
+  vec = va_arg (va, svmfloat8_t);
+  va_end (va);
+  svst1 (svptrue_b8 (), ptr, vec);
+}
+
+/*
+** caller_7:
+**	...
+**	mov	(z[0-9]+\.b), w8
+**	...
+**	st1b	\1, p[0-7], \[x7\]
+**	...
+**	ret
+*/
+void __attribute__((noipa))
+caller_7 (mfloat8_t *ptr, mfloat8_t in)
+{
+  callee_7 (ptr, 1, 2, 3, 4, 5, 6, svdup_mf8 (in));
+}
+
+/* FIXME: We should be able to get rid of the va_list object.  */
+/*
+** callee_8:
+**	sub	sp, sp, #([0-9]+)
+**	...
+**	ldr	(x[0-9]+), \[sp, \1\]
+**	...
+**	ld1b	(z[0-9]+\.b), (p[0-7])/z, \[\2\]
+**	...
+**	st1b	\3, \4, \[x0\]
+**	...
+**	ret
+*/
+void __attribute__((noipa))
+callee_8 (mfloat8_t *ptr, ...)
+{
+  va_list va;
+  svmfloat8_t vec;
+
+  va_start (va, ptr);
+  va_arg (va, int);
+  va_arg (va, int);
+  va_arg (va, int);
+  va_arg (va, int);
+  va_arg (va, int);
+  va_arg (va, int);
+  va_arg (va, int);
+  vec = va_arg (va, svmfloat8_t);
+  va_end (va);
+  svst1 (svptrue_b8 (), ptr, vec);
+}
+
+/*
+** caller_8:
+**	...
+**	mov	(z[0-9]+\.b), w1
+**	...
+**	st1b	\1, p[0-7], \[(x[0-9]+)\]
+**	...
+**	str	\2, \[sp\]
+**	...
+**	ret
+*/
+void __attribute__((noipa))
+caller_8 (mfloat8_t *ptr, mfloat8_t in)
+{
+  callee_8 (ptr, 1, 2, 3, 4, 5, 6, 7, svdup_mf8 (in));
+}
diff --git a/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/tbl2_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/tbl2_mf8.c
new file mode 100644
index 00000000000..19cc739e7ab
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/tbl2_mf8.c
@@ -0,0 +1,31 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** tbl2_mf8_tied1:
+**	tbl	z0\.b, {z0\.b(?:, | - )z1\.b}, z4\.b
+**	ret
+*/
+TEST_TBL2 (tbl2_mf8_tied1, svmfloat8x2_t, svmfloat8_t, svuint8_t,
+	   z0_res = svtbl2_mf8 (z0, z4),
+	   z0_res = svtbl2 (z0, z4))
+
+/*
+** tbl2_mf8_tied2:
+**	tbl	z0\.b, {z1\.b(?:, | - )z2\.b}, z0\.b
+**	ret
+*/
+TEST_TBL2_REV (tbl2_mf8_tied2, svmfloat8x2_t, svmfloat8_t, svuint8_t,
+	       z0_res = svtbl2_mf8 (z1, z0),
+	       z0_res = svtbl2 (z1, z0))
+
+/*
+** tbl2_mf8_untied:
+**	tbl	z0\.b, {z2\.b(?:, | - )z3\.b}, z4\.b
+**	ret
+*/
+TEST_TBL2 (tbl2_mf8_untied, svmfloat8x2_t, svmfloat8_t, svuint8_t,
+	   z0_res = svtbl2_mf8 (z2, z4),
+	   z0_res = svtbl2 (z2, z4))
+
diff --git a/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/tbx_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/tbx_mf8.c
new file mode 100644
index 00000000000..ba0fef3934b
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/tbx_mf8.c
@@ -0,0 +1,37 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** tbx_mf8_tied1:
+**	tbx	z0\.b, z1\.b, z4\.b
+**	ret
+*/
+TEST_DUAL_Z (tbx_mf8_tied1, svmfloat8_t, svuint8_t,
+	     z0 = svtbx_mf8 (z0, z1, z4),
+	     z0 = svtbx (z0, z1, z4))
+
+/* Bad RA choice: no preferred output sequence.  */
+TEST_DUAL_Z (tbx_mf8_tied2, svmfloat8_t, svuint8_t,
+	     z0 = svtbx_mf8 (z1, z0, z4),
+	     z0 = svtbx (z1, z0, z4))
+
+/* Bad RA choice: no preferred output sequence.  */
+TEST_DUAL_Z_REV (tbx_mf8_tied3, svmfloat8_t, svuint8_t,
+		 z0_res = svtbx_mf8 (z4, z5, z0),
+		 z0_res = svtbx (z4, z5, z0))
+
+/*
+** tbx_mf8_untied:
+** (
+**	mov	z0\.d, z1\.d
+**	tbx	z0\.b, z2\.b, z4\.b
+** |
+**	tbx	z1\.b, z2\.b, z4\.b
+**	mov	z0\.d, z1\.d
+** )
+**	ret
+*/
+TEST_DUAL_Z (tbx_mf8_untied, svmfloat8_t, svuint8_t,
+	     z0 = svtbx_mf8 (z1, z2, z4),
+	     z0 = svtbx (z1, z2, z4))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/whilerw_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/whilerw_mf8.c
new file mode 100644
index 00000000000..12cf0d2c365
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/whilerw_mf8.c
@@ -0,0 +1,50 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" { target { ! ilp32 } } } } */
+
+#include "test_sve_acle.h"
+
+/*
+** whilerw_rr_mf8:
+**	whilerw	p0\.b, x0, x1
+**	ret
+*/
+TEST_COMPARE_S (whilerw_rr_mf8, const mfloat8_t *,
+		p0 = svwhilerw_mf8 (x0, x1),
+		p0 = svwhilerw (x0, x1))
+
+/*
+** whilerw_0r_mf8:
+**	whilerw	p0\.b, xzr, x1
+**	ret
+*/
+TEST_COMPARE_S (whilerw_0r_mf8, const mfloat8_t *,
+		p0 = svwhilerw_mf8 ((const mfloat8_t *) 0, x1),
+		p0 = svwhilerw ((const mfloat8_t *) 0, x1))
+
+/*
+** whilerw_cr_mf8:
+**	mov	(x[0-9]+), #?1073741824
+**	whilerw	p0\.b, \1, x1
+**	ret
+*/
+TEST_COMPARE_S (whilerw_cr_mf8, const mfloat8_t *,
+		p0 = svwhilerw_mf8 ((const mfloat8_t *) 1073741824, x1),
+		p0 = svwhilerw ((const mfloat8_t *) 1073741824, x1))
+
+/*
+** whilerw_r0_mf8:
+**	whilerw	p0\.b, x0, xzr
+**	ret
+*/
+TEST_COMPARE_S (whilerw_r0_mf8, const mfloat8_t *,
+		p0 = svwhilerw_mf8 (x0, (const mfloat8_t *) 0),
+		p0 = svwhilerw (x0, (const mfloat8_t *) 0))
+
+/*
+** whilerw_rc_mf8:
+**	mov	(x[0-9]+), #?1073741824
+**	whilerw	p0\.b, x0, \1
+**	ret
+*/
+TEST_COMPARE_S (whilerw_rc_mf8, const mfloat8_t *,
+		p0 = svwhilerw_mf8 (x0, (const mfloat8_t *) 1073741824),
+		p0 = svwhilerw (x0, (const mfloat8_t *) 1073741824))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/whilewr_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/whilewr_mf8.c
new file mode 100644
index 00000000000..c4023a2fbff
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/whilewr_mf8.c
@@ -0,0 +1,50 @@
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" { target { ! ilp32 } } } } */
+
+#include "test_sve_acle.h"
+
+/*
+** whilewr_rr_mf8:
+**	whilewr	p0\.b, x0, x1
+**	ret
+*/
+TEST_COMPARE_S (whilewr_rr_mf8, const mfloat8_t *,
+		p0 = svwhilewr_mf8 (x0, x1),
+		p0 = svwhilewr (x0, x1))
+
+/*
+** whilewr_0r_mf8:
+**	whilewr	p0\.b, xzr, x1
+**	ret
+*/
+TEST_COMPARE_S (whilewr_0r_mf8, const mfloat8_t *,
+		p0 = svwhilewr_mf8 ((const mfloat8_t *) 0, x1),
+		p0 = svwhilewr ((const mfloat8_t *) 0, x1))
+
+/*
+** whilewr_cr_mf8:
+**	mov	(x[0-9]+), #?1073741824
+**	whilewr	p0\.b, \1, x1
+**	ret
+*/
+TEST_COMPARE_S (whilewr_cr_mf8, const mfloat8_t *,
+		p0 = svwhilewr_mf8 ((const mfloat8_t *) 1073741824, x1),
+		p0 = svwhilewr ((const mfloat8_t *) 1073741824, x1))
+
+/*
+** whilewr_r0_mf8:
+**	whilewr	p0\.b, x0, xzr
+**	ret
+*/
+TEST_COMPARE_S (whilewr_r0_mf8, const mfloat8_t *,
+		p0 = svwhilewr_mf8 (x0, (const mfloat8_t *) 0),
+		p0 = svwhilewr (x0, (const mfloat8_t *) 0))
+
+/*
+** whilewr_rc_mf8:
+**	mov	(x[0-9]+), #?1073741824
+**	whilewr	p0\.b, x0, \1
+**	ret
+*/
+TEST_COMPARE_S (whilewr_rc_mf8, const mfloat8_t *,
+		p0 = svwhilewr_mf8 (x0, (const mfloat8_t *) 1073741824),
+		p0 = svwhilewr (x0, (const mfloat8_t *) 1073741824))

From patchwork Fri Nov  8 16:10:19 2024
Content-Type: text/plain; charset="utf-8"
MIME-Version: 1.0
Content-Transfer-Encoding: 7bit
X-Patchwork-Submitter: Claudio Bantaloukas <claudio.bantaloukas@arm.com>
X-Patchwork-Id: 2008634
Return-Path: <gcc-patches-bounces~incoming=patchwork.ozlabs.org@gcc.gnu.org>
X-Original-To: incoming@patchwork.ozlabs.org
Delivered-To: patchwork-incoming@legolas.ozlabs.org
Authentication-Results: legolas.ozlabs.org;
	dkim=pass (1024-bit key;
 unprotected) header.d=arm.com header.i=@arm.com header.a=rsa-sha256
 header.s=selector1 header.b=LDSlf25K;
	dkim=pass (1024-bit key) header.d=arm.com header.i=@arm.com
 header.a=rsa-sha256 header.s=selector1 header.b=LDSlf25K;
	dkim-atps=neutral
Authentication-Results: legolas.ozlabs.org;
 spf=pass (sender SPF authorized) smtp.mailfrom=gcc.gnu.org
 (client-ip=8.43.85.97; helo=server2.sourceware.org;
 envelope-from=gcc-patches-bounces~incoming=patchwork.ozlabs.org@gcc.gnu.org;
 receiver=patchwork.ozlabs.org)
Received: from server2.sourceware.org (server2.sourceware.org [8.43.85.97])
	(using TLSv1.3 with cipher TLS_AES_256_GCM_SHA384 (256/256 bits)
	 key-exchange X25519 server-signature ECDSA (secp384r1) server-digest SHA384)
	(No client certificate requested)
	by legolas.ozlabs.org (Postfix) with ESMTPS id 4XlP9Q2RWNz1xyM
	for <incoming@patchwork.ozlabs.org>; Sat,  9 Nov 2024 03:12:42 +1100 (AEDT)
Received: from server2.sourceware.org (localhost [IPv6:::1])
	by sourceware.org (Postfix) with ESMTP id 4E0E63857BB0
	for <incoming@patchwork.ozlabs.org>; Fri,  8 Nov 2024 16:12:39 +0000 (GMT)
X-Original-To: gcc-patches@gcc.gnu.org
Delivered-To: gcc-patches@gcc.gnu.org
Received: from EUR05-VI1-obe.outbound.protection.outlook.com
 (mail-vi1eur05on20604.outbound.protection.outlook.com
 [IPv6:2a01:111:f403:2613::604])
 by sourceware.org (Postfix) with ESMTPS id D77DB3858D3C
 for <gcc-patches@gcc.gnu.org>; Fri,  8 Nov 2024 16:10:44 +0000 (GMT)
DMARC-Filter: OpenDMARC Filter v1.4.2 sourceware.org D77DB3858D3C
Authentication-Results: sourceware.org;
 dmarc=pass (p=none dis=none) header.from=arm.com
Authentication-Results: sourceware.org; spf=pass smtp.mailfrom=arm.com
ARC-Filter: OpenARC Filter v1.0.0 sourceware.org D77DB3858D3C
Authentication-Results: server2.sourceware.org;
 arc=pass smtp.remote-ip=2a01:111:f403:2613::604
ARC-Seal: i=3; a=rsa-sha256; d=sourceware.org; s=key; t=1731082250; cv=pass;
 b=Ov05/G6v8GRhIGUEpkeBdyzXGfSMUf4290K9Ra1hizCZips0HmXddIE9BPXT5gL2tHU3JcdTLq61auhTDY2Oo5JWYwlPRtuhG2738z9s1cq5qHsX0GF9vrskcRIe/NRI9igHoikJcX6BKrqaXbjBDhgqVCc/XgpXicORXaypydE=
ARC-Message-Signature: i=3; a=rsa-sha256; d=sourceware.org; s=key;
 t=1731082250; c=relaxed/simple;
 bh=p/7Pu5elMqD4+VOPuVDfjPL6vX28EXrFiqLVBKGaKT8=;
 h=DKIM-Signature:DKIM-Signature:From:To:Subject:Date:Message-ID:
 MIME-Version;
 b=WysZ3l0N2u65bmCoAZCP/oze158ciCWO7gxxPLC5uWo6BubGJjA8VCGGmYC8h4qTyWYfOtw9hfImPb5GxBjOKwfjNqkwDPkTTZtAIFqUJI19Uidaa0BdkgsfVP6CF8gpRlYO8v1ezXiluBgiOHDpzNWr5bVI35iLz4xzpULm85w=
ARC-Authentication-Results: i=3; server2.sourceware.org
ARC-Seal: i=2; a=rsa-sha256; s=arcselector10001; d=microsoft.com; cv=pass;
 b=vI8kwxJpVEYJlVkIhVCJqgLLGiR/rYu/HUto1oIzrv53vfDmYR5TJYNmXLs1n+E7wXOyrk578h2hCh+1zcHTrD7j2PxuuTHEWSARfMr1VV6TmSnd0aC4HIDonn3abO0E3aUhPwMy4D4viXplzcQL057Ln1yVkQxUbuEZaSltcC+Sl3vJgvzsX8CKqWGLHmJ0q3iO1uH1O1mmix26nARqVQI1cA+5ArT7bMctp6QD6/srJJBuXS/Cwsac7spVlK3yLPH9FcyCGi0UdxHfx80LQOmitvoTTyk7etmeUFMQqMko+yVzvDPux6rP0wygb8Xdwogi2tEoqr6JbkO2h70yrQ==
ARC-Message-Signature: i=2; a=rsa-sha256; c=relaxed/relaxed; d=microsoft.com;
 s=arcselector10001;
 h=From:Date:Subject:Message-ID:Content-Type:MIME-Version:X-MS-Exchange-AntiSpam-MessageData-ChunkCount:X-MS-Exchange-AntiSpam-MessageData-0:X-MS-Exchange-AntiSpam-MessageData-1;
 bh=4BDWSNTL4wT0mbmjwqrHpSjKJbO6GjmF+h8Lqcb3EWo=;
 b=Vdl5i4SYZs4uxTGDQcc6oD44xqWDmDuzBqFLOHiMETvY6WljF9sNPIGEMEfgU4Z9m1z7SOs/SHmKQIvyKQTxLbMVNEUbVAsqnsokZwEngBAKFofReU4D1RgfcyiQoGgMkh/vEGadl2lBTZ2/sISpQDyV5NQVvzngxiEUGVH5D3gaR2Pqnx8NKLCJfJaPASfYVMP4ZN1/ETDidm0+1IMwskXLGCeimb0Wnn1fc3RNRtD9Ak8bh9GpDeaAmrvSYxgpai6d+gkCwTLkV7uXqKOooiFeTwXdWdbFnfKKmBfJxaY49g3rqj4MwcG/IYnXvB+Y/hAGYGot//XUBBkWYGn1iw==
ARC-Authentication-Results: i=2; mx.microsoft.com 1; spf=pass (sender ip is
 63.35.35.123) smtp.rcpttodomain=gcc.gnu.org smtp.mailfrom=arm.com; dmarc=pass
 (p=none sp=none pct=100) action=none header.from=arm.com; dkim=pass
 (signature was verified) header.d=arm.com; arc=pass (0 oda=1 ltdi=1
 spf=[1,1,smtp.mailfrom=arm.com] dmarc=[1,1,header.from=arm.com])
DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=arm.com; s=selector1;
 h=From:Date:Subject:Message-ID:Content-Type:MIME-Version:X-MS-Exchange-SenderADCheck;
 bh=4BDWSNTL4wT0mbmjwqrHpSjKJbO6GjmF+h8Lqcb3EWo=;
 b=LDSlf25KLg9gkT4OLy4kIftv20omE0c4e1ql4aUCS7Rjw1k6kVEe8oA237sa1ntOabRVK+oWTQrDdh1548Cub8FiTDL1TP1A5+mRIgGZX2w8KQAjDlpXXQpm2JPZMa0S2R0fZV6tTmKAzSnd+sW25TvshW79AMpT3tf/xS+Lnv8=
Received: from AS4PR10CA0014.EURPRD10.PROD.OUTLOOK.COM (2603:10a6:20b:5dc::18)
 by VI1PR08MB10243.eurprd08.prod.outlook.com (2603:10a6:800:1bf::8)
 with Microsoft SMTP Server (version=TLS1_2,
 cipher=TLS_ECDHE_RSA_WITH_AES_256_GCM_SHA384) id 15.20.8137.19; Fri, 8 Nov
 2024 16:10:39 +0000
Received: from AM1PEPF000252DD.eurprd07.prod.outlook.com
 (2603:10a6:20b:5dc:cafe::9c) by AS4PR10CA0014.outlook.office365.com
 (2603:10a6:20b:5dc::18) with Microsoft SMTP Server (version=TLS1_2,
 cipher=TLS_ECDHE_RSA_WITH_AES_256_GCM_SHA384) id 15.20.8137.21 via Frontend
 Transport; Fri, 8 Nov 2024 16:10:39 +0000
X-MS-Exchange-Authentication-Results: spf=pass (sender IP is 63.35.35.123)
 smtp.mailfrom=arm.com; dkim=pass (signature was verified)
 header.d=arm.com;dmarc=pass action=none header.from=arm.com;
Received-SPF: Pass (protection.outlook.com: domain of arm.com designates
 63.35.35.123 as permitted sender) receiver=protection.outlook.com;
 client-ip=63.35.35.123; helo=64aa7808-outbound-1.mta.getcheckrecipient.com;
 pr=C
Received: from 64aa7808-outbound-1.mta.getcheckrecipient.com (63.35.35.123) by
 AM1PEPF000252DD.mail.protection.outlook.com (10.167.16.55) with
 Microsoft
 SMTP Server (version=TLS1_3, cipher=TLS_AES_256_GCM_SHA384) id 15.20.8137.17
 via Frontend Transport; Fri, 8 Nov 2024 16:10:39 +0000
Received: ("Tessian outbound c60e9fd8cfde:v490");
 Fri, 08 Nov 2024 16:10:39 +0000
X-CheckRecipientChecked: true
X-CR-MTA-CID: 92f683af7a70fb11
X-TessianGatewayMetadata: 
 hx9opW3U7oBdx1YCz+jleTqZUnmc6gRwonl+RRV/4RHI3bypBiEdef5UnAf0inZK+TXvUYrKHAgv9UFDQpq47r4gEg4tCRJyCH9prE3KCVP0VtTZVcmNKJNWQ2QQ7V2rk5ncMD89KGiGGpZld99WN8QDsw2HvQK76QXoIZX9mnk=
X-CR-MTA-TID: 64aa7808
Received: from L7a01d5a9fe15.1
 by 64aa7808-outbound-1.mta.getcheckrecipient.com id
 43274675-740D-40E9-9DAF-35309752FD82.1;
 Fri, 08 Nov 2024 16:10:33 +0000
Received: from EUR03-AM7-obe.outbound.protection.outlook.com
 by 64aa7808-outbound-1.mta.getcheckrecipient.com with ESMTPS id
 L7a01d5a9fe15.1 (version=TLSv1.3 cipher=TLS_AES_256_GCM_SHA384);
 Fri, 08 Nov 2024 16:10:33 +0000
ARC-Seal: i=1; a=rsa-sha256; s=arcselector10001; d=microsoft.com; cv=none;
 b=kHJxyflFYXdMBNO0Wy95Vu3FQim4g53epkiJwTSjo/v9BSeIUXvWTmew5SzPF49ElnRLLwjqrC/5HKwJRy0GwrfXas26D24WTUFwzW+BY02pD11j0I1gG3ABi+GIWP9/0x11U1FzrQprCL5GeUjkGJd5PthtOrky0IQk12TWJaLEA0fqlSC86m1AQK3c5dmTNc/VTn/fJ54MpX5GbhjN2MgHjDvu6/DrgWcf9JvzNeN0qMOvQPvUDX7TQDgYUAi4a2oqIiTWTv5tp+iwUYKGa3swzmGERZYaMnS2EJ5JNCVOB6i/CzDQP+6iVq7GNBVuHZDLGCgnPFFkqEBoUgw9mw==
ARC-Message-Signature: i=1; a=rsa-sha256; c=relaxed/relaxed; d=microsoft.com;
 s=arcselector10001;
 h=From:Date:Subject:Message-ID:Content-Type:MIME-Version:X-MS-Exchange-AntiSpam-MessageData-ChunkCount:X-MS-Exchange-AntiSpam-MessageData-0:X-MS-Exchange-AntiSpam-MessageData-1;
 bh=4BDWSNTL4wT0mbmjwqrHpSjKJbO6GjmF+h8Lqcb3EWo=;
 b=u3qRTn3Mus5UBM7NQWWm96T5weomlM6HChS3zhpeD5w2kclbF8LPdvk5mrQ/PW5qTu8gGUhs2LbgQqN4mOkau9ziVvxZ1xXMtrbc3DzN4UPHgdOao2dil9NMXvYYDV/4h4Xt1EgCcs/VBbw9RmbtU/dnXMx5iMm9Zi1VSUN0aE6qC8H58p0mhnF5zQfxdbSPkEkV3Mi69HZFU49Wj51z6G+K3ZL370Qgz3Zbl7JCDs9U31CLYjLkZgJlRqDXgTCEn8a1SCXEkT5ZQAuh/1hPR5z5sKFt8yq4w0uHkoz2FLvuDtGWkZ4qn2UN6akzxD8D2S0WVmhG+3UC1j1qWcgUUg==
ARC-Authentication-Results: i=1; mx.microsoft.com 1; spf=pass (sender ip is
 40.67.248.234) smtp.rcpttodomain=gcc.gnu.org smtp.mailfrom=arm.com;
 dmarc=pass (p=none sp=none pct=100) action=none header.from=arm.com;
 dkim=none (message not signed); arc=none (0)
DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=arm.com; s=selector1;
 h=From:Date:Subject:Message-ID:Content-Type:MIME-Version:X-MS-Exchange-SenderADCheck;
 bh=4BDWSNTL4wT0mbmjwqrHpSjKJbO6GjmF+h8Lqcb3EWo=;
 b=LDSlf25KLg9gkT4OLy4kIftv20omE0c4e1ql4aUCS7Rjw1k6kVEe8oA237sa1ntOabRVK+oWTQrDdh1548Cub8FiTDL1TP1A5+mRIgGZX2w8KQAjDlpXXQpm2JPZMa0S2R0fZV6tTmKAzSnd+sW25TvshW79AMpT3tf/xS+Lnv8=
Received: from DB6PR0301CA0070.eurprd03.prod.outlook.com (2603:10a6:6:30::17)
 by GV1PR08MB10480.eurprd08.prod.outlook.com (2603:10a6:150:15f::22)
 with Microsoft SMTP Server (version=TLS1_2,
 cipher=TLS_ECDHE_RSA_WITH_AES_256_GCM_SHA384) id 15.20.8137.19; Fri, 8 Nov
 2024 16:10:26 +0000
Received: from DB5PEPF00014B8B.eurprd02.prod.outlook.com
 (2603:10a6:6:30:cafe::87) by DB6PR0301CA0070.outlook.office365.com
 (2603:10a6:6:30::17) with Microsoft SMTP Server (version=TLS1_2,
 cipher=TLS_ECDHE_RSA_WITH_AES_256_GCM_SHA384) id 15.20.8137.21 via Frontend
 Transport; Fri, 8 Nov 2024 16:10:26 +0000
X-MS-Exchange-Authentication-Results: spf=pass (sender IP is 40.67.248.234)
 smtp.mailfrom=arm.com; dkim=none (message not signed)
 header.d=none;dmarc=pass action=none header.from=arm.com;
Received-SPF: Pass (protection.outlook.com: domain of arm.com designates
 40.67.248.234 as permitted sender) receiver=protection.outlook.com;
 client-ip=40.67.248.234; helo=nebula.arm.com; pr=C
Received: from nebula.arm.com (40.67.248.234) by
 DB5PEPF00014B8B.mail.protection.outlook.com (10.167.8.199) with Microsoft
 SMTP Server (version=TLS1_2, cipher=TLS_ECDHE_RSA_WITH_AES_128_GCM_SHA256) id
 15.20.8137.17 via Frontend Transport; Fri, 8 Nov 2024 16:10:26 +0000
Received: from AZ-NEU-EX04.Arm.com (10.251.24.32) by AZ-NEU-EX03.Arm.com
 (10.251.24.31) with Microsoft SMTP Server (version=TLS1_2,
 cipher=TLS_ECDHE_RSA_WITH_AES_128_GCM_SHA256) id 15.1.2507.39; Fri, 8 Nov
 2024 16:10:25 +0000
Received: from 221664dbf3aa.euhpc2.arm.com (10.58.86.32) by mail.arm.com
 (10.251.24.32) with Microsoft SMTP Server id 15.1.2507.39 via Frontend
 Transport; Fri, 8 Nov 2024 16:10:25 +0000
From: Claudio Bantaloukas <claudio.bantaloukas@arm.com>
To: <gcc-patches@gcc.gnu.org>
CC: Claudio Bantaloukas <claudio.bantaloukas@arm.com>
Subject: [PATCH v2 3/4] aarch64: specify fpm mode in function instances and
 groups
Date: Fri, 8 Nov 2024 16:10:19 +0000
Message-ID: <20241108161020.921071-4-claudio.bantaloukas@arm.com>
X-Mailer: git-send-email 2.43.0
In-Reply-To: <20241108161020.921071-1-claudio.bantaloukas@arm.com>
References: <20241108161020.921071-1-claudio.bantaloukas@arm.com>
MIME-Version: 1.0
X-EOPAttributedMessage: 1
X-MS-TrafficTypeDiagnostic: 
 DB5PEPF00014B8B:EE_|GV1PR08MB10480:EE_|AM1PEPF000252DD:EE_|VI1PR08MB10243:EE_
X-MS-Office365-Filtering-Correlation-Id: a5ab8ef7-7b8b-4a12-7646-08dd000fe378
x-checkrecipientrouted: true
NoDisclaimer: true
X-MS-Exchange-SenderADCheck: 1
X-MS-Exchange-AntiSpam-Relay: 0
X-Microsoft-Antispam-Untrusted: BCL:0;
 ARA:13230040|1800799024|82310400026|36860700013|376014;
X-Microsoft-Antispam-Message-Info-Original: 
 ls9QX34OUjwv+Tt/eOt6Uw34/i1RTuOU110oyzh84zpc+Me285HjPpo62MsBKGVLgmLAd2Iwco0sUAnn6Yh/u0MKnq+fofJhpkYXdxuvMza2245EU3jZmTq3/84xNDkCHlAm8v1bBF/WO4g0An0BoNGc82l5rfLkQV2u/q+BzoIVRImVIW3bilOqbOtXPss+y49gK7T8fVC//ZaERI+g9nOQFRThPG0XmBbJ8QsFqcJYDDaYY8CQ/0SFC9jqiYa1AkCfInxCMyGnPt1Vzigr8di4nHPxYHcnjp+WMhWYOqEnUoG3vIWTotkL866SKn5V2PMKqR2GmG8Bv3dgVFyhusIvY8fb9f51SYsnsebZ3QIJb6lba1FTpcxPe23dQPZdY7oENxDyLVb/45xBVKHk2vHuARuTkz5TN8YsphcnMMTEq6F17N1pMW7BVSBc1NDLysW1mn2s10nWuVNig4z7r07LlgaLkP88jygt2fiYZRavTX7yfgyG9g4PWZDmCZktWKLrnHb+J6OHdRQ5LZBAj1RhBZiG+rOOZRtBVfFLqwG3APyR2hBpQ2uwz/hgpi4OzDZOQgHx/LU5QEDjFucD5iLTWPflNgsWO9+rJ6utx+aVdgTak+lUs0MCX+vk+d03fzRulAI61K861Va5ah1o3mYyTcXfi35EhlGnh808cjip7I4a8b+WTs0qAApQEQYseY7XWWOPrac8k4mxubwLABBDiV+Qz6zBwCQV6u5LxoFncBd6QZf2Dg/cJRH/2oQohUJhhuaefVjyoJj5p3A2qe7sHtdUGQKIss2m4tIk6U/eZdXZ5SmiixbqfJC7THdazT3wwVzGLUGW7tM7lj7uE6PB9e7r2J4ek0McNGiuvD7BnFFUJE7Jw0TlQD06yling2oLk4QzlmbrwBwxfMDh/chTIb+viMqHlzqlVVoqa/UvB+DFamZRCh987YQYC9OMdnojwMEqUSNKAZHLTnru+XwV+iOxXfpntS8Lu7rr2YEtuh2owH07Y2VhqD3IBH36l5B3oSU3uIc5xd7BiWggkgv6R1BgVCaesU84yfQ7UbYmxiNOsZnhf4fpKmI5iTs2AOEz+a1k1d2azyPomZWiy0b/YJBJZyQfLMJAP/Z3IuIrWO0xrLCgJVARAGBtvjBk41irkVCUEeFV152IMAngH7HchHxUqqcYpsVTBj2cpeEa2kJoTP3/pta12AUQ+sNQBMjwD4pQhy++uaiRe5bwriRUjGp98Ue1plFumdEsIIA7l6Kd7N48yygxMwx3m9waZkGanJWMdNubsRfBdk787ayYa1pe+zySJUOVR/S/geYU/OCafYMaJaE1Zm1ykrlQw/QxzjVkFYV2DnNYa0Wb9HW1fiIzmE90KF7QNVaIxuetxTo2xiwrDGKouoMKPh5qqL5qfWWdPLTcF61HyQ7eLQ==
X-Forefront-Antispam-Report-Untrusted: CIP:40.67.248.234; CTRY:IE; LANG:en;
 SCL:1; SRV:; IPV:NLI; SFV:NSPM; H:nebula.arm.com; PTR:InfoDomainNonexistent;
 CAT:NONE; SFS:(13230040)(1800799024)(82310400026)(36860700013)(376014);
 DIR:OUT; SFP:1101;
X-MS-Exchange-Transport-CrossTenantHeadersStamped: GV1PR08MB10480
X-MS-Exchange-SkipListedInternetSender: ip=[2603:10a6:6:30::17];
 domain=DB6PR0301CA0070.eurprd03.prod.outlook.com
X-MS-Exchange-Transport-CrossTenantHeadersStripped: 
 AM1PEPF000252DD.eurprd07.prod.outlook.com
X-MS-PublicTrafficType: Email
X-MS-Office365-Filtering-Correlation-Id-Prvs: 
 a0399548-399c-4cfb-144a-08dd000fdb5f
X-Microsoft-Antispam: BCL:0;
 ARA:13230040|35042699022|376014|82310400026|14060799003|36860700013|1800799024;
X-Microsoft-Antispam-Message-Info: =?utf-8?q?0ufHCcyXpnbMOj6s+Ak3yufXd2TcYz4?=
	=?utf-8?q?yHlQyRTdARSUuSJFKp69Ku/uh/vLauylpM4cA8tr0RD0gM6dGfkEmXPsassQK56ub?=
	=?utf-8?q?HhhMOTA4eJRwBMxt5f5HCXxRPFCmOR1lThBTxV9U0ps6sYx3doD+GtpjPucGrkxyu?=
	=?utf-8?q?BrY8YgOARwbOc4h4y+5HbGeAh5WAwr+ACIM3Q0w4sohZ5qBbEyDPhYkfhKr7krki3?=
	=?utf-8?q?35MJTOA4QMqvjB5Y2ymdwfjruwBAiYZ81qpRHprTPR19ubEeGUrhJcoqRvBtMo4hx?=
	=?utf-8?q?U9VB9TUen/aqSKqVwBzh2GXrOn99GMFFvt+wCaqpXtXG5XJHga5+AgUl5sK6pR/xz?=
	=?utf-8?q?qdC0SpC9f8sFELT7QHzdVTsIeheGjast8e9VbLvSgNqU81vpvQahvAqoSGWDVuYXy?=
	=?utf-8?q?N30jUhZK0T303U39Lj6xBDLx0fTlgpHTMtH5Cvivr4s1T+1GWy+8BRm3AmWlW7/rZ?=
	=?utf-8?q?/bCjNuk0o9us3WU12ANg8CU/5UAfHX3QG4rVttXnrY0gW3aLExXJAlqZ5joCmH/fd?=
	=?utf-8?q?8uRdqtkl44BDH60Qq+INJLzTiQsW2M1Ni2jfNEl90JHw2lUoiZLirwVIQkki1Mdfn?=
	=?utf-8?q?kU6mcgX3ANDUTgO+FOq4aZDighf8MqNw5gvqbOx26QA9z5BvVJXaseriqC5OtcfiE?=
	=?utf-8?q?sbcP42Ou1UcPsagTVSSxUFDJli8WAUTqjtq5epSP1WLRBiq9r6JcQZW814HycLDSl?=
	=?utf-8?q?SHa7VIgicaBWMO19nT3c18LdV2xjzRbNlOxRuju9UNv436Zi6+MrU2WhUtvfsGkaq?=
	=?utf-8?q?Y3Sh9gxbQY2ipCwL7NkmJ9EQnmI7MK7iZCO2/tr8aeD8YJA23ggpwJ4xoQ5dl6wI8?=
	=?utf-8?q?vq4QYVkcEKncyOxwD8vn6yjG6D8lkKgiveE6SQH/ZukiTGuQUr312cicTm4BtSbaE?=
	=?utf-8?q?4QQPt34C94z0w4WYObf7BtiguL4pupY3J/0G7OtloloohRiTrzG1Ull6VMRumh0ML?=
	=?utf-8?q?EBzovYkZZ0+OT+K78Gp0gm+hj3sCWWJLvobFEzFJQAhL0zhLTLZy7KOVcJoXnfoQq?=
	=?utf-8?q?jfpWUqnSgb6QdaLVsvDUGxie5ilR0j4ZMUffhSdNHA6IYywvSd2aT/aHSp+n0JP3M?=
	=?utf-8?q?5ObAkixzPdfd0CdYfmpeXZIwWV6Oj5w2d1ryDOVkjaIcpvGjhWdDsJe0NzmhSnDL0?=
	=?utf-8?q?Lgj2Vt6QuPePJ1lxqFlW8d9SGkYCxmhk4p2ZHr72pWkyfRF8DttwLMAuFPi7LWLmS?=
	=?utf-8?q?eNgJei4lbfrBw07MQaadgGllct54G2kS2FaW2lOfzXCc5npqGe4u8+vcQ9htiNK8X?=
	=?utf-8?q?pRS4c+543IhJlH/64BeNcsNXohy9Jq0NfCFfDnSl7JRBUwTfwflsXQ5unXLDYrUdt?=
	=?utf-8?q?3kHfLAYz6OXXSw+L9v9hcO1MP7dWwK8QoA=3D=3D?=
X-Forefront-Antispam-Report: CIP:63.35.35.123; CTRY:IE; LANG:en; SCL:1; SRV:;
 IPV:CAL; SFV:NSPM; H:64aa7808-outbound-1.mta.getcheckrecipient.com;
 PTR:ec2-63-35-35-123.eu-west-1.compute.amazonaws.com; CAT:NONE;
 SFS:(13230040)(35042699022)(376014)(82310400026)(14060799003)(36860700013)(1800799024);
 DIR:OUT; SFP:1101;
X-OriginatorOrg: arm.com
X-MS-Exchange-CrossTenant-OriginalArrivalTime: 08 Nov 2024 16:10:39.6529 (UTC)
X-MS-Exchange-CrossTenant-Network-Message-Id: 
 a5ab8ef7-7b8b-4a12-7646-08dd000fe378
X-MS-Exchange-CrossTenant-Id: f34e5979-57d9-4aaa-ad4d-b122a662184d
X-MS-Exchange-CrossTenant-OriginalAttributedTenantConnectingIp: 
 TenantId=f34e5979-57d9-4aaa-ad4d-b122a662184d; Ip=[63.35.35.123];
 Helo=[64aa7808-outbound-1.mta.getcheckrecipient.com]
X-MS-Exchange-CrossTenant-AuthSource: 
 AM1PEPF000252DD.eurprd07.prod.outlook.com
X-MS-Exchange-CrossTenant-AuthAs: Anonymous
X-MS-Exchange-CrossTenant-FromEntityHeader: HybridOnPrem
X-MS-Exchange-Transport-CrossTenantHeadersStamped: VI1PR08MB10243
X-BeenThere: gcc-patches@gcc.gnu.org
X-Mailman-Version: 2.1.30
Precedence: list
List-Id: Gcc-patches mailing list <gcc-patches.gcc.gnu.org>
List-Unsubscribe: <https://gcc.gnu.org/mailman/options/gcc-patches>,
 <mailto:gcc-patches-request@gcc.gnu.org?subject=unsubscribe>
List-Archive: <https://gcc.gnu.org/pipermail/gcc-patches/>
List-Post: <mailto:gcc-patches@gcc.gnu.org>
List-Help: <mailto:gcc-patches-request@gcc.gnu.org?subject=help>
List-Subscribe: <https://gcc.gnu.org/mailman/listinfo/gcc-patches>,
 <mailto:gcc-patches-request@gcc.gnu.org?subject=subscribe>
Errors-To: gcc-patches-bounces~incoming=patchwork.ozlabs.org@gcc.gnu.org

Some intrinsics require setting the fpm register before calling the
specific asm opcode required.
In order to simplify review, this patch:
- adds the fpm_mode_index attribute to function_group_info and
  function_instance objects
- updates existing initialisations and call sites.
- updates equality and hash operations

gcc/
	* config/aarch64/aarch64-sve-builtins-base.cc
	(svdiv_impl): Specify FPM_unused when folding.
	(svmul_impl): Likewise.
	* config/aarch64/aarch64-sve-builtins-base.def
	(svreinterpret): Specify FPM_unused mode
	* config/aarch64/aarch64-sve-builtins-shapes.cc
	(build_one): Use the group fpm_mode when creating function instances.
	* config/aarch64/aarch64-sve-builtins-sme.def
	(DEF_SME_FUNCTION): specify FPM_unset mode
	(DEF_SME_ZA_FUNCTION_GS): Allow specifying fpm mode
	(DEF_SME_ZA_FUNCTION): specify FPM_unset mode
	(svadd,svadd_write,svdot, svdot_lane, svluti2_lane_zt, svluti4_lane_zt,
	svmla, svmla_lane, svmls, svmls_lane, svread, svread_hor, svread_ver,
	svsub, svsub_write, svsudot, svsudot_lane, svsuvdot_lane, svusdot,
	svusdot_lane, svusvdot_lane, svvdot_lane, svwrite, svwrite_hor,
	svwrite_ver): Likewise
	* config/aarch64/aarch64-sve-builtins-sve2.cc
	(svaba_impl, svqrshl_impl, svqshl_impl,svrshl_impl, svsra_impl):
	Specify FPM_unused when folding.
	* config/aarch64/aarch64-sve-builtins-sve2.def
	(svadd, svclamp, svcvt, svcvtn, svld1, svldnt1, svmax, svmaxnm, svmin,
	svminnm, svpext_lane, svqcvt, svqcvtn, svqdmulh, svqrshr, svqrshrn,
	svqrshru, svqrshrun, svrinta, svrintm, svrintn, svrintp, svrshl, svsel,
	svst1, svstnt1,	svunpk,	svuzp, svuzpq, svwhilege, svwhilegt, svwhilele,
	svwhilelt, svzip, svzipq): Likewise
	* config/aarch64/aarch64-sve-builtins.cc (function_groups): Set
	fpm_mode on all elements.
	(neon_sve_function_groups, sme_function_groups): Likewise.
	(function_instance::hash): Include fpm_mode in hash.
	(function_builder::add_overloaded_functions): Use the group fpm mode.
	(function_resolver::lookup_form): Use the function instance fpm_mode
	when looking up a function.
	* config/aarch64/aarch64-sve-builtins.def
	(DEF_SVE_FUNCTION_GS): add argument.
	(DEF_SVE_FUNCTION): specify FPM_unset mode.
	* config/aarch64/aarch64-sve-builtins.h (fpm_mode_index): New.
	(function_group_info): Add fpm_mode.
	(function_instance): Likewise.
	(function_instance::operator==): Handle fpm_mode.
---
 .../aarch64/aarch64-sve-builtins-base.cc      |  15 +-
 .../aarch64/aarch64-sve-builtins-base.def     |   3 +-
 .../aarch64/aarch64-sve-builtins-shapes.cc    |   3 +-
 .../aarch64/aarch64-sve-builtins-sme.def      | 130 ++++++++++--------
 .../aarch64/aarch64-sve-builtins-sve2.cc      |  20 ++-
 .../aarch64/aarch64-sve-builtins-sve2.def     |  96 +++++++------
 gcc/config/aarch64/aarch64-sve-builtins.cc    |  23 ++--
 gcc/config/aarch64/aarch64-sve-builtins.def   |   4 +-
 gcc/config/aarch64/aarch64-sve-builtins.h     |  25 +++-
 9 files changed, 188 insertions(+), 131 deletions(-)

diff --git a/gcc/config/aarch64/aarch64-sve-builtins-base.cc b/gcc/config/aarch64/aarch64-sve-builtins-base.cc
index 1c9f515a52c..893ecb5f080 100644
--- a/gcc/config/aarch64/aarch64-sve-builtins-base.cc
+++ b/gcc/config/aarch64/aarch64-sve-builtins-base.cc
@@ -774,7 +774,8 @@ public:
       {
 	function_instance instance ("svneg", functions::svneg,
 				    shapes::unary, MODE_none,
-				    f.type_suffix_ids, GROUP_none, f.pred);
+				    f.type_suffix_ids, GROUP_none, f.pred,
+				    FPM_unused);
 	gcall *call = f.redirect_call (instance);
 	unsigned offset_index = 0;
 	if (f.pred == PRED_m)
@@ -802,7 +803,8 @@ public:
       {
 	function_instance instance ("svlsr", functions::svlsr,
 				    shapes::binary_uint_opt_n, MODE_n,
-				    f.type_suffix_ids, GROUP_none, f.pred);
+				    f.type_suffix_ids, GROUP_none, f.pred,
+				    FPM_unused);
 	call = f.redirect_call (instance);
 	tree d = INTEGRAL_TYPE_P (TREE_TYPE (op2)) ? op2 : op2_cst;
 	new_divisor = wide_int_to_tree (TREE_TYPE (d), tree_log2 (d));
@@ -815,7 +817,8 @@ public:
 
 	function_instance instance ("svasrd", functions::svasrd,
 				    shapes::shift_right_imm, MODE_n,
-				    f.type_suffix_ids, GROUP_none, f.pred);
+				    f.type_suffix_ids, GROUP_none, f.pred,
+				    FPM_unused);
 	call = f.redirect_call (instance);
 	new_divisor = wide_int_to_tree (scalar_types[VECTOR_TYPE_svuint64_t],
 					tree_log2 (op2_cst));
@@ -2092,7 +2095,8 @@ public:
       {
 	function_instance instance ("svneg", functions::svneg,
 				    shapes::unary, MODE_none,
-				    f.type_suffix_ids, GROUP_none, f.pred);
+				    f.type_suffix_ids, GROUP_none, f.pred,
+				    FPM_unused);
 	gcall *call = f.redirect_call (instance);
 	unsigned offset_index = 0;
 	if (f.pred == PRED_m)
@@ -2133,7 +2137,8 @@ public:
 				      tree_log2 (shift_op2));
 	function_instance instance ("svlsl", functions::svlsl,
 				    shapes::binary_uint_opt_n, MODE_n,
-				    f.type_suffix_ids, GROUP_none, f.pred);
+				    f.type_suffix_ids, GROUP_none, f.pred,
+				    FPM_unused);
 	gcall *call = f.redirect_call (instance);
 	gimple_call_set_arg (call, 1, shift_op1);
 	gimple_call_set_arg (call, 2, shift_op2);
diff --git a/gcc/config/aarch64/aarch64-sve-builtins-base.def b/gcc/config/aarch64/aarch64-sve-builtins-base.def
index da2a0e41aa5..1230ad78d09 100644
--- a/gcc/config/aarch64/aarch64-sve-builtins-base.def
+++ b/gcc/config/aarch64/aarch64-sve-builtins-base.def
@@ -200,7 +200,8 @@ DEF_SVE_FUNCTION (svrbit, unary, all_integer, mxz)
 DEF_SVE_FUNCTION (svrecpe, unary, all_float, none)
 DEF_SVE_FUNCTION (svrecps, binary, all_float, none)
 DEF_SVE_FUNCTION (svrecpx, unary, all_float, mxz)
-DEF_SVE_FUNCTION_GS (svreinterpret, reinterpret, reinterpret, x1234, none)
+DEF_SVE_FUNCTION_GS (svreinterpret, reinterpret, reinterpret, x1234, none,
+		     unused)
 DEF_SVE_FUNCTION (svreinterpret, reinterpret, reinterpret_b, none)
 DEF_SVE_FUNCTION (svrev, unary, all_data, none)
 DEF_SVE_FUNCTION (svrev, unary_pred, all_pred, none)
diff --git a/gcc/config/aarch64/aarch64-sve-builtins-shapes.cc b/gcc/config/aarch64/aarch64-sve-builtins-shapes.cc
index f190770250f..51f7cfdf96f 100644
--- a/gcc/config/aarch64/aarch64-sve-builtins-shapes.cc
+++ b/gcc/config/aarch64/aarch64-sve-builtins-shapes.cc
@@ -350,7 +350,8 @@ build_one (function_builder &b, const char *signature,
   auto_vec<tree, 16> argument_types;
   function_instance instance (group.base_name, *group.base, *group.shape,
 			      mode_suffix_id, group.types[ti],
-			      group.groups[gi], group.preds[pi]);
+			      group.groups[gi], group.preds[pi],
+			      group.fpm_mode);
   tree return_type = parse_signature (instance, signature, argument_types);
   apply_predication (instance, return_type, argument_types);
   b.add_unique_function (instance, return_type, argument_types,
diff --git a/gcc/config/aarch64/aarch64-sve-builtins-sme.def b/gcc/config/aarch64/aarch64-sve-builtins-sme.def
index bc2c3323636..55d04900ec2 100644
--- a/gcc/config/aarch64/aarch64-sve-builtins-sme.def
+++ b/gcc/config/aarch64/aarch64-sve-builtins-sme.def
@@ -19,17 +19,17 @@
 
 #ifndef DEF_SME_FUNCTION
 #define DEF_SME_FUNCTION(NAME, SHAPE, TYPES, PREDS) \
-  DEF_SME_FUNCTION_GS (NAME, SHAPE, TYPES, none, PREDS)
+  DEF_SME_FUNCTION_GS (NAME, SHAPE, TYPES, none, PREDS, unused)
 #endif
 
 #ifndef DEF_SME_ZA_FUNCTION_GS
-#define DEF_SME_ZA_FUNCTION_GS(NAME, SHAPE, TYPES, GROUP, PREDS) \
-  DEF_SME_FUNCTION_GS (NAME, SHAPE, TYPES, GROUP, PREDS)
+#define DEF_SME_ZA_FUNCTION_GS(NAME, SHAPE, TYPES, GROUP, PREDS, FPM_MODE) \
+  DEF_SME_FUNCTION_GS (NAME, SHAPE, TYPES, GROUP, PREDS, FPM_MODE)
 #endif
 
 #ifndef DEF_SME_ZA_FUNCTION
 #define DEF_SME_ZA_FUNCTION(NAME, SHAPE, TYPES, PREDS) \
-  DEF_SME_ZA_FUNCTION_GS (NAME, SHAPE, TYPES, none, PREDS)
+  DEF_SME_ZA_FUNCTION_GS (NAME, SHAPE, TYPES, none, PREDS, unused)
 #endif
 
 #define REQUIRED_EXTENSIONS streaming_compatible (0)
@@ -97,113 +97,123 @@ DEF_SME_FUNCTION (svzero_zt, inherent_zt, none, none)
    floating-point function.  They are needed because the integer and
    floating-point functions have different architecture requirements.  */
 #define REQUIRED_EXTENSIONS streaming_only (AARCH64_FL_SME2)
-DEF_SME_ZA_FUNCTION_GS (svadd, unary_za_slice, za_s_data, vg1x24, none)
-DEF_SME_ZA_FUNCTION_GS (svadd, unary_za_slice, d_za, vg1x24, none)
+DEF_SME_ZA_FUNCTION_GS (svadd, unary_za_slice, za_s_data, vg1x24, none, unused)
+DEF_SME_ZA_FUNCTION_GS (svadd, unary_za_slice, d_za, vg1x24, none, unused)
 DEF_SME_ZA_FUNCTION_GS (svadd_write, binary_za_slice_opt_single, za_s_integer,
-			vg1x24, none)
+			vg1x24, none, unused)
 DEF_SME_ZA_FUNCTION (svbmopa, binary_za_m, za_s_unsigned, za_m)
 DEF_SME_ZA_FUNCTION (svbmops, binary_za_m, za_s_unsigned, za_m)
 DEF_SME_ZA_FUNCTION_GS (svdot, binary_za_slice_opt_single, za_s_h_data,
-			vg1x24, none)
+			vg1x24, none, unused)
 DEF_SME_ZA_FUNCTION_GS (svdot, binary_za_slice_opt_single, za_s_b_integer,
-			vg1x24, none)
+			vg1x24, none, unused)
 DEF_SME_ZA_FUNCTION_GS (svdot_lane, dot_za_slice_lane, za_s_h_data,
-			vg1x24, none)
+			vg1x24, none, unused)
 DEF_SME_ZA_FUNCTION_GS (svdot_lane, dot_za_slice_lane, za_s_b_integer,
-			vg1x24, none)
-DEF_SME_FUNCTION_GS (svluti2_lane_zt, luti2_lane_zt, bhs_data, x124, none)
-DEF_SME_FUNCTION_GS (svluti4_lane_zt, luti4_lane_zt, bhs_data, x12, none)
-DEF_SME_FUNCTION_GS (svluti4_lane_zt, luti4_lane_zt, hs_data, x4, none)
+			vg1x24, none, unused)
+DEF_SME_FUNCTION_GS (svluti2_lane_zt, luti2_lane_zt, bhs_data, x124, none,
+			unused)
+DEF_SME_FUNCTION_GS (svluti4_lane_zt, luti4_lane_zt, bhs_data, x12, none,
+			unused)
+DEF_SME_FUNCTION_GS (svluti4_lane_zt, luti4_lane_zt, hs_data, x4, none,
+			unused)
 DEF_SME_ZA_FUNCTION_GS (svmla, binary_za_slice_opt_single, za_s_float,
-			vg1x24, none)
+			vg1x24, none, unused)
 DEF_SME_ZA_FUNCTION_GS (svmla, binary_za_slice_opt_single, za_s_h_data,
-			vg2, none)
+			vg2, none, unused)
 DEF_SME_ZA_FUNCTION_GS (svmla, binary_za_slice_opt_single, za_s_b_integer,
-			vg4, none)
+			vg4, none, unused)
 DEF_SME_ZA_FUNCTION_GS (svmla_lane, binary_za_slice_lane, za_s_float,
-			vg1x24, none)
+			vg1x24, none, unused)
 DEF_SME_ZA_FUNCTION_GS (svmla_lane, binary_za_slice_lane, za_s_h_data,
-			vg2, none)
+			vg2, none, unused)
 DEF_SME_ZA_FUNCTION_GS (svmla_lane, binary_za_slice_lane, za_s_b_integer,
-			vg4, none)
+			vg4, none, unused)
 DEF_SME_ZA_FUNCTION_GS (svmls, binary_za_slice_opt_single, za_s_float,
-			vg1x24, none)
+			vg1x24, none, unused)
 DEF_SME_ZA_FUNCTION_GS (svmls, binary_za_slice_opt_single, za_s_h_data,
-			vg2, none)
+			vg2, none, unused)
 DEF_SME_ZA_FUNCTION_GS (svmls, binary_za_slice_opt_single, za_s_b_integer,
-			vg4, none)
+			vg4, none, unused)
 DEF_SME_ZA_FUNCTION_GS (svmls_lane, binary_za_slice_lane, za_s_float,
-			vg1x24, none)
+			vg1x24, none, unused)
 DEF_SME_ZA_FUNCTION_GS (svmls_lane, binary_za_slice_lane, za_s_h_data,
-			vg2, none)
+			vg2, none, unused)
 DEF_SME_ZA_FUNCTION_GS (svmls_lane, binary_za_slice_lane, za_s_b_integer,
-			vg4, none)
+			vg4, none, unused)
 DEF_SME_ZA_FUNCTION (svmopa, binary_za_m, za_s_h_integer, za_m)
 DEF_SME_ZA_FUNCTION (svmops, binary_za_m, za_s_h_integer, za_m)
-DEF_SME_ZA_FUNCTION_GS (svread, read_za_slice, za_bhsd_data, vg1x24, none)
-DEF_SME_ZA_FUNCTION_GS (svread_hor, read_za, za_bhsd_data, vg24, none)
-DEF_SME_ZA_FUNCTION_GS (svread_ver, read_za, za_bhsd_data, vg24, none)
-DEF_SME_ZA_FUNCTION_GS (svsub, unary_za_slice, za_s_data, vg1x24, none)
-DEF_SME_ZA_FUNCTION_GS (svsub, unary_za_slice, d_za, vg1x24, none)
+DEF_SME_ZA_FUNCTION_GS (svread, read_za_slice, za_bhsd_data, vg1x24, none, unused)
+DEF_SME_ZA_FUNCTION_GS (svread_hor, read_za, za_bhsd_data, vg24, none, unused)
+DEF_SME_ZA_FUNCTION_GS (svread_ver, read_za, za_bhsd_data, vg24, none, unused)
+DEF_SME_ZA_FUNCTION_GS (svsub, unary_za_slice, za_s_data, vg1x24, none, unused)
+DEF_SME_ZA_FUNCTION_GS (svsub, unary_za_slice, d_za, vg1x24, none, unused)
 DEF_SME_ZA_FUNCTION_GS (svsub_write, binary_za_slice_opt_single, za_s_integer,
-			vg1x24, none)
+			vg1x24, none, unused)
 DEF_SME_ZA_FUNCTION_GS (svsudot, binary_za_slice_uint_opt_single,
-		        za_s_b_signed, vg1x24, none)
+		        za_s_b_signed, vg1x24, none, unused)
 DEF_SME_ZA_FUNCTION_GS (svsudot_lane, dot_za_slice_uint_lane,
-			za_s_b_signed, vg1x24, none)
+			za_s_b_signed, vg1x24, none, unused)
 DEF_SME_ZA_FUNCTION_GS (svsuvdot_lane, dot_za_slice_uint_lane,
-			za_s_b_signed, vg1x4, none)
+			za_s_b_signed, vg1x4, none, unused)
 DEF_SME_ZA_FUNCTION_GS (svusdot, binary_za_slice_int_opt_single,
-		        za_s_b_unsigned, vg1x24, none)
+		        za_s_b_unsigned, vg1x24, none, unused)
 DEF_SME_ZA_FUNCTION_GS (svusdot_lane, dot_za_slice_int_lane,
-			za_s_b_unsigned, vg1x24, none)
+			za_s_b_unsigned, vg1x24, none, unused)
 DEF_SME_ZA_FUNCTION_GS (svusvdot_lane, dot_za_slice_int_lane,
-			za_s_b_unsigned, vg1x4, none)
+			za_s_b_unsigned, vg1x4, none, unused)
 DEF_SME_ZA_FUNCTION_GS (svvdot_lane, dot_za_slice_lane, za_s_h_data,
-			vg1x2, none)
+			vg1x2, none, unused)
 DEF_SME_ZA_FUNCTION_GS (svvdot_lane, dot_za_slice_lane, za_s_b_integer,
-			vg1x4, none)
-DEF_SME_ZA_FUNCTION_GS (svwrite, write_za_slice, za_bhsd_data, vg1x24, none)
-DEF_SME_ZA_FUNCTION_GS (svwrite_hor, write_za, za_bhsd_data, vg24, none)
-DEF_SME_ZA_FUNCTION_GS (svwrite_ver, write_za, za_bhsd_data, vg24, none)
+			vg1x4, none, unused)
+DEF_SME_ZA_FUNCTION_GS (svwrite, write_za_slice, za_bhsd_data, vg1x24, none,
+			unused)
+DEF_SME_ZA_FUNCTION_GS (svwrite_hor, write_za, za_bhsd_data, vg24, none,
+			unused)
+DEF_SME_ZA_FUNCTION_GS (svwrite_ver, write_za, za_bhsd_data, vg24, none,
+			unused)
 #undef REQUIRED_EXTENSIONS
 
 #define REQUIRED_EXTENSIONS streaming_only (AARCH64_FL_SME2 \
 					    | AARCH64_FL_SME_I16I64)
-DEF_SME_ZA_FUNCTION_GS (svadd, unary_za_slice, za_d_integer, vg1x24, none)
+DEF_SME_ZA_FUNCTION_GS (svadd, unary_za_slice, za_d_integer, vg1x24, none,
+			unused)
 DEF_SME_ZA_FUNCTION_GS (svadd_write, binary_za_slice_opt_single, za_d_integer,
-			vg1x24, none)
+			vg1x24, none, unused)
 DEF_SME_ZA_FUNCTION_GS (svdot, binary_za_slice_opt_single, za_d_h_integer,
-			vg1x24, none)
+			vg1x24, none, unused)
 DEF_SME_ZA_FUNCTION_GS (svdot_lane, dot_za_slice_lane, za_d_h_integer,
-			vg1x24, none)
+			vg1x24, none, unused)
 DEF_SME_ZA_FUNCTION_GS (svmla, binary_za_slice_opt_single, za_d_h_integer,
-			vg4, none)
+			vg4, none, unused)
 DEF_SME_ZA_FUNCTION_GS (svmla_lane, binary_za_slice_lane, za_d_h_integer,
-			vg4, none)
+			vg4, none, unused)
 DEF_SME_ZA_FUNCTION_GS (svmls, binary_za_slice_opt_single, za_d_h_integer,
-			vg4, none)
+			vg4, none, unused)
 DEF_SME_ZA_FUNCTION_GS (svmls_lane, binary_za_slice_lane, za_d_h_integer,
-			vg4, none)
-DEF_SME_ZA_FUNCTION_GS (svsub, unary_za_slice, za_d_integer, vg1x24, none)
+			vg4, none, unused)
+DEF_SME_ZA_FUNCTION_GS (svsub, unary_za_slice, za_d_integer, vg1x24, none,
+			unused)
 DEF_SME_ZA_FUNCTION_GS (svsub_write, binary_za_slice_opt_single, za_d_integer,
-			vg1x24, none)
+			vg1x24, none, unused)
 DEF_SME_ZA_FUNCTION_GS (svvdot_lane, dot_za_slice_lane, za_d_h_integer,
-			vg1x4, none)
+			vg1x4, none, unused)
 #undef REQUIRED_EXTENSIONS
 
 #define REQUIRED_EXTENSIONS streaming_only (AARCH64_FL_SME2 \
 					    | AARCH64_FL_SME_F64F64)
-DEF_SME_ZA_FUNCTION_GS (svadd, unary_za_slice, za_d_float, vg1x24, none)
+DEF_SME_ZA_FUNCTION_GS (svadd, unary_za_slice, za_d_float, vg1x24, none,
+			unused)
 DEF_SME_ZA_FUNCTION_GS (svmla, binary_za_slice_opt_single, za_d_float,
-			vg1x24, none)
+			vg1x24, none, unused)
 DEF_SME_ZA_FUNCTION_GS (svmla_lane, binary_za_slice_lane, za_d_float,
-			vg1x24, none)
+			vg1x24, none, unused)
 DEF_SME_ZA_FUNCTION_GS (svmls, binary_za_slice_opt_single, za_d_float,
-			vg1x24, none)
+			vg1x24, none, unused)
 DEF_SME_ZA_FUNCTION_GS (svmls_lane, binary_za_slice_lane, za_d_float,
-			vg1x24, none)
-DEF_SME_ZA_FUNCTION_GS (svsub, unary_za_slice, za_d_float, vg1x24, none)
+			vg1x24, none, unused)
+DEF_SME_ZA_FUNCTION_GS (svsub, unary_za_slice, za_d_float, vg1x24, none,
+			unused)
 #undef REQUIRED_EXTENSIONS
 
 #undef DEF_SME_ZA_FUNCTION
diff --git a/gcc/config/aarch64/aarch64-sve-builtins-sve2.cc b/gcc/config/aarch64/aarch64-sve-builtins-sve2.cc
index f0ab7400ef5..d09b75b60c2 100644
--- a/gcc/config/aarch64/aarch64-sve-builtins-sve2.cc
+++ b/gcc/config/aarch64/aarch64-sve-builtins-sve2.cc
@@ -90,7 +90,8 @@ public:
       return NULL;
     function_instance instance ("svabd", functions::svabd,
 				shapes::binary_opt_n, f.mode_suffix_id,
-				f.type_suffix_ids, GROUP_none, PRED_x);
+				f.type_suffix_ids, GROUP_none, PRED_x,
+				FPM_unused);
     gcall *call = f.redirect_call (instance);
     /* Add a ptrue as predicate, because unlike svaba, svabd is
        predicated.  */
@@ -338,7 +339,8 @@ public:
 	       that we can use for sensible shift amounts.  */
 	    function_instance instance ("svqshl", functions::svqshl,
 					shapes::binary_int_opt_n, MODE_n,
-					f.type_suffix_ids, GROUP_none, f.pred);
+					f.type_suffix_ids, GROUP_none, f.pred,
+					FPM_unused);
 	    return f.redirect_call (instance);
 	  }
 	else
@@ -348,7 +350,7 @@ public:
 	    function_instance instance ("svrshl", functions::svrshl,
 					shapes::binary_int_opt_single_n,
 					MODE_n, f.type_suffix_ids, GROUP_none,
-					f.pred);
+					f.pred, FPM_unused);
 	    return f.redirect_call (instance);
 	  }
       }
@@ -377,7 +379,8 @@ public:
 				       -wi::to_wide (amount));
 	    function_instance instance ("svasr", functions::svasr,
 					shapes::binary_uint_opt_n, MODE_n,
-					f.type_suffix_ids, GROUP_none, f.pred);
+					f.type_suffix_ids, GROUP_none, f.pred,
+					FPM_unused);
 	    if (f.type_suffix (0).unsigned_p)
 	      {
 		instance.base_name = "svlsr";
@@ -412,7 +415,8 @@ public:
 	       that we can use for sensible shift amounts.  */
 	    function_instance instance ("svlsl", functions::svlsl,
 					shapes::binary_uint_opt_n, MODE_n,
-					f.type_suffix_ids, GROUP_none, f.pred);
+					f.type_suffix_ids, GROUP_none, f.pred,
+					FPM_unused);
 	    gcall *call = f.redirect_call (instance);
 	    gimple_call_set_arg (call, 2, amount);
 	    return call;
@@ -425,7 +429,8 @@ public:
 				       -wi::to_wide (amount));
 	    function_instance instance ("svrshr", functions::svrshr,
 					shapes::shift_right_imm, MODE_n,
-					f.type_suffix_ids, GROUP_none, f.pred);
+					f.type_suffix_ids, GROUP_none, f.pred,
+					FPM_unused);
 	    gcall *call = f.redirect_call (instance);
 	    gimple_call_set_arg (call, 2, amount);
 	    return call;
@@ -461,7 +466,8 @@ public:
       return NULL;
     function_instance instance ("svlsr", functions::svlsr,
 				shapes::binary_uint_opt_n, MODE_n,
-				f.type_suffix_ids, GROUP_none, PRED_x);
+				f.type_suffix_ids, GROUP_none, PRED_x,
+				FPM_unused);
     if (!f.type_suffix (0).unsigned_p)
       {
 	instance.base_name = "svasr";
diff --git a/gcc/config/aarch64/aarch64-sve-builtins-sve2.def b/gcc/config/aarch64/aarch64-sve-builtins-sve2.def
index e4021559f36..8d25bb33dad 100644
--- a/gcc/config/aarch64/aarch64-sve-builtins-sve2.def
+++ b/gcc/config/aarch64/aarch64-sve-builtins-sve2.def
@@ -227,61 +227,73 @@ DEF_SVE_FUNCTION (svrevd, unary, all_data, mxz)
 #undef REQUIRED_EXTENSIONS
 
 #define REQUIRED_EXTENSIONS streaming_only (AARCH64_FL_SME2)
-DEF_SVE_FUNCTION_GS (svadd, binary_single, all_integer, x24, none)
+DEF_SVE_FUNCTION_GS (svadd, binary_single, all_integer, x24, none, unused)
 DEF_SVE_FUNCTION (svbfmlslb, ternary_bfloat_opt_n, s_float, none)
 DEF_SVE_FUNCTION (svbfmlslb_lane, ternary_bfloat_lane, s_float, none)
 DEF_SVE_FUNCTION (svbfmlslt, ternary_bfloat_opt_n, s_float, none)
 DEF_SVE_FUNCTION (svbfmlslt_lane, ternary_bfloat_lane, s_float, none)
 DEF_SVE_FUNCTION (svclamp, clamp, all_float, none)
-DEF_SVE_FUNCTION_GS (svclamp, clamp, all_arith, x24, none)
+DEF_SVE_FUNCTION_GS (svclamp, clamp, all_arith, x24, none, unused)
 DEF_SVE_FUNCTION (svcntp, count_pred_c, all_count, none)
-DEF_SVE_FUNCTION_GS (svcvt, unary_convertxn, cvt_h_s_float, x2, none)
-DEF_SVE_FUNCTION_GS (svcvt, unary_convertxn, cvt_s_s, x24, none)
-DEF_SVE_FUNCTION_GS (svcvtn, unary_convertxn, cvt_h_s_float, x2, none)
+DEF_SVE_FUNCTION_GS (svcvt, unary_convertxn, cvt_h_s_float, x2, none, unused)
+DEF_SVE_FUNCTION_GS (svcvt, unary_convertxn, cvt_s_s, x24, none, unused)
+DEF_SVE_FUNCTION_GS (svcvtn, unary_convertxn, cvt_h_s_float, x2, none, unused)
 DEF_SVE_FUNCTION (svdot, ternary_qq_opt_n_or_011, s_narrow_fsu, none)
 DEF_SVE_FUNCTION (svdot_lane, ternary_qq_or_011_lane, s_narrow_fsu, none)
-DEF_SVE_FUNCTION_GS (svld1, load, all_data, x24, implicit)
-DEF_SVE_FUNCTION_GS (svldnt1, load, all_data, x24, implicit)
-DEF_SVE_FUNCTION_GS (svmax, binary_opt_single_n, all_arith, x24, none)
-DEF_SVE_FUNCTION_GS (svmaxnm, binary_opt_single_n, all_float, x24, none)
-DEF_SVE_FUNCTION_GS (svmin, binary_opt_single_n, all_arith, x24, none)
-DEF_SVE_FUNCTION_GS (svminnm, binary_opt_single_n, all_float, x24, none)
-DEF_SVE_FUNCTION_GS (svpext_lane, extract_pred, all_count, x12, none)
+DEF_SVE_FUNCTION_GS (svld1, load, all_data, x24, implicit, unused)
+DEF_SVE_FUNCTION_GS (svldnt1, load, all_data, x24, implicit, unused)
+DEF_SVE_FUNCTION_GS (svmax, binary_opt_single_n, all_arith, x24, none, unused)
+DEF_SVE_FUNCTION_GS (svmaxnm, binary_opt_single_n, all_float, x24, none,
+			unused)
+DEF_SVE_FUNCTION_GS (svmin, binary_opt_single_n, all_arith, x24, none, unused)
+DEF_SVE_FUNCTION_GS (svminnm, binary_opt_single_n, all_float, x24, none,
+			unused)
+DEF_SVE_FUNCTION_GS (svpext_lane, extract_pred, all_count, x12, none, unused)
 DEF_SVE_FUNCTION (svptrue, inherent, all_count, none)
-DEF_SVE_FUNCTION_GS (svqcvt, unary_convertxn, qcvt_x2, x2, none)
-DEF_SVE_FUNCTION_GS (svqcvt, unary_convertxn, qcvt_x4, x4, none)
-DEF_SVE_FUNCTION_GS (svqcvtn, unary_convertxn, qcvt_x2, x2, none)
-DEF_SVE_FUNCTION_GS (svqcvtn, unary_convertxn, qcvt_x4, x4, none)
-DEF_SVE_FUNCTION_GS (svqdmulh, binary_opt_single_n, all_signed, x24, none)
-DEF_SVE_FUNCTION_GS (svqrshr, shift_right_imm_narrowxn, qrshr_x2, x2, none)
-DEF_SVE_FUNCTION_GS (svqrshr, shift_right_imm_narrowxn, qrshr_x4, x4, none)
-DEF_SVE_FUNCTION_GS (svqrshrn, shift_right_imm_narrowxn, qrshr_x2, x2, none)
-DEF_SVE_FUNCTION_GS (svqrshrn, shift_right_imm_narrowxn, qrshr_x4, x4, none)
-DEF_SVE_FUNCTION_GS (svqrshru, shift_right_imm_narrowxn, qrshru_x2, x2, none)
-DEF_SVE_FUNCTION_GS (svqrshru, shift_right_imm_narrowxn, qrshru_x4, x4, none)
-DEF_SVE_FUNCTION_GS (svqrshrun, shift_right_imm_narrowxn, qrshru_x2, x2, none)
-DEF_SVE_FUNCTION_GS (svqrshrun, shift_right_imm_narrowxn, qrshru_x4, x4, none)
-DEF_SVE_FUNCTION_GS (svrinta, unaryxn, s_float, x24, none)
-DEF_SVE_FUNCTION_GS (svrintm, unaryxn, s_float, x24, none)
-DEF_SVE_FUNCTION_GS (svrintn, unaryxn, s_float, x24, none)
-DEF_SVE_FUNCTION_GS (svrintp, unaryxn, s_float, x24, none)
-DEF_SVE_FUNCTION_GS (svrshl, binary_int_opt_single_n, all_integer, x24, none)
-DEF_SVE_FUNCTION_GS (svsel, binaryxn, all_data, x24, implicit)
-DEF_SVE_FUNCTION_GS (svst1, storexn, all_data, x24, implicit)
-DEF_SVE_FUNCTION_GS (svstnt1, storexn, all_data, x24, implicit)
-DEF_SVE_FUNCTION_GS (svunpk, unary_convertxn, bhs_widen, x24, none)
-DEF_SVE_FUNCTION_GS (svuzp, unaryxn, all_data, x24, none)
-DEF_SVE_FUNCTION_GS (svuzpq, unaryxn, all_data, x24, none)
-DEF_SVE_FUNCTION_GS (svwhilege, compare_scalar, while_x, x2, none)
+DEF_SVE_FUNCTION_GS (svqcvt, unary_convertxn, qcvt_x2, x2, none, unused)
+DEF_SVE_FUNCTION_GS (svqcvt, unary_convertxn, qcvt_x4, x4, none, unused)
+DEF_SVE_FUNCTION_GS (svqcvtn, unary_convertxn, qcvt_x2, x2, none, unused)
+DEF_SVE_FUNCTION_GS (svqcvtn, unary_convertxn, qcvt_x4, x4, none, unused)
+DEF_SVE_FUNCTION_GS (svqdmulh, binary_opt_single_n, all_signed, x24, none,
+			unused)
+DEF_SVE_FUNCTION_GS (svqrshr, shift_right_imm_narrowxn, qrshr_x2, x2, none,
+			unused)
+DEF_SVE_FUNCTION_GS (svqrshr, shift_right_imm_narrowxn, qrshr_x4, x4, none,
+			unused)
+DEF_SVE_FUNCTION_GS (svqrshrn, shift_right_imm_narrowxn, qrshr_x2, x2, none,
+			unused)
+DEF_SVE_FUNCTION_GS (svqrshrn, shift_right_imm_narrowxn, qrshr_x4, x4, none,
+			unused)
+DEF_SVE_FUNCTION_GS (svqrshru, shift_right_imm_narrowxn, qrshru_x2, x2, none,
+			unused)
+DEF_SVE_FUNCTION_GS (svqrshru, shift_right_imm_narrowxn, qrshru_x4, x4, none,
+			unused)
+DEF_SVE_FUNCTION_GS (svqrshrun, shift_right_imm_narrowxn, qrshru_x2, x2, none,
+			unused)
+DEF_SVE_FUNCTION_GS (svqrshrun, shift_right_imm_narrowxn, qrshru_x4, x4, none,
+			unused)
+DEF_SVE_FUNCTION_GS (svrinta, unaryxn, s_float, x24, none, unused)
+DEF_SVE_FUNCTION_GS (svrintm, unaryxn, s_float, x24, none, unused)
+DEF_SVE_FUNCTION_GS (svrintn, unaryxn, s_float, x24, none, unused)
+DEF_SVE_FUNCTION_GS (svrintp, unaryxn, s_float, x24, none, unused)
+DEF_SVE_FUNCTION_GS (svrshl, binary_int_opt_single_n, all_integer, x24, none,
+			unused)
+DEF_SVE_FUNCTION_GS (svsel, binaryxn, all_data, x24, implicit, unused)
+DEF_SVE_FUNCTION_GS (svst1, storexn, all_data, x24, implicit, unused)
+DEF_SVE_FUNCTION_GS (svstnt1, storexn, all_data, x24, implicit, unused)
+DEF_SVE_FUNCTION_GS (svunpk, unary_convertxn, bhs_widen, x24, none, unused)
+DEF_SVE_FUNCTION_GS (svuzp, unaryxn, all_data, x24, none, unused)
+DEF_SVE_FUNCTION_GS (svuzpq, unaryxn, all_data, x24, none, unused)
+DEF_SVE_FUNCTION_GS (svwhilege, compare_scalar, while_x, x2, none, unused)
 DEF_SVE_FUNCTION (svwhilege, compare_scalar_count, while_x_c, none)
-DEF_SVE_FUNCTION_GS (svwhilegt, compare_scalar, while_x, x2, none)
+DEF_SVE_FUNCTION_GS (svwhilegt, compare_scalar, while_x, x2, none, unused)
 DEF_SVE_FUNCTION (svwhilegt, compare_scalar_count, while_x_c, none)
-DEF_SVE_FUNCTION_GS (svwhilele, compare_scalar, while_x, x2, none)
+DEF_SVE_FUNCTION_GS (svwhilele, compare_scalar, while_x, x2, none, unused)
 DEF_SVE_FUNCTION (svwhilele, compare_scalar_count, while_x_c, none)
-DEF_SVE_FUNCTION_GS (svwhilelt, compare_scalar, while_x, x2, none)
+DEF_SVE_FUNCTION_GS (svwhilelt, compare_scalar, while_x, x2, none, unused)
 DEF_SVE_FUNCTION (svwhilelt, compare_scalar_count, while_x_c, none)
-DEF_SVE_FUNCTION_GS (svzip, unaryxn, all_data, x24, none)
-DEF_SVE_FUNCTION_GS (svzipq, unaryxn, all_data, x24, none)
+DEF_SVE_FUNCTION_GS (svzip, unaryxn, all_data, x24, none, unused)
+DEF_SVE_FUNCTION_GS (svzipq, unaryxn, all_data, x24, none, unused)
 #undef REQUIRED_EXTENSIONS
 
 #define REQUIRED_EXTENSIONS \
diff --git a/gcc/config/aarch64/aarch64-sve-builtins.cc b/gcc/config/aarch64/aarch64-sve-builtins.cc
index 34384c0f5d7..dfe6221e5c2 100644
--- a/gcc/config/aarch64/aarch64-sve-builtins.cc
+++ b/gcc/config/aarch64/aarch64-sve-builtins.cc
@@ -890,9 +890,10 @@ static const predication_index preds_za_m[] = { PRED_za_m, NUM_PREDS };
 
 /* A list of all arm_sve.h functions.  */
 static CONSTEXPR const function_group_info function_groups[] = {
-#define DEF_SVE_FUNCTION_GS(NAME, SHAPE, TYPES, GROUPS, PREDS) \
+#define DEF_SVE_FUNCTION_GS(NAME, SHAPE, TYPES, GROUPS, PREDS, FPM_MODE) \
   { #NAME, &functions::NAME, &shapes::SHAPE, types_##TYPES, groups_##GROUPS, \
-    preds_##PREDS, aarch64_required_extensions::REQUIRED_EXTENSIONS },
+    preds_##PREDS, aarch64_required_extensions::REQUIRED_EXTENSIONS, \
+    FPM_##FPM_MODE },
 #include "aarch64-sve-builtins.def"
 };
 
@@ -900,20 +901,22 @@ static CONSTEXPR const function_group_info function_groups[] = {
 static CONSTEXPR const function_group_info neon_sve_function_groups[] = {
 #define DEF_NEON_SVE_FUNCTION(NAME, SHAPE, TYPES, GROUPS, PREDS) \
   { #NAME, &neon_sve_bridge_functions::NAME, &shapes::SHAPE, types_##TYPES, \
-    groups_##GROUPS, preds_##PREDS, aarch64_required_extensions::ssve (0) },
+    groups_##GROUPS, preds_##PREDS, aarch64_required_extensions::ssve (0), \
+    FPM_unused },
 #include "aarch64-neon-sve-bridge-builtins.def"
 };
 
 /* A list of all arm_sme.h functions.  */
 static CONSTEXPR const function_group_info sme_function_groups[] = {
-#define DEF_SME_FUNCTION_GS(NAME, SHAPE, TYPES, GROUPS, PREDS) \
+#define DEF_SME_FUNCTION_GS(NAME, SHAPE, TYPES, GROUPS, PREDS, FPM_MODE1) \
   { #NAME, &functions::NAME, &shapes::SHAPE, types_##TYPES, groups_##GROUPS, \
-    preds_##PREDS, aarch64_required_extensions::REQUIRED_EXTENSIONS },
-#define DEF_SME_ZA_FUNCTION_GS(NAME, SHAPE, TYPES, GROUPS, PREDS) \
+    preds_##PREDS, aarch64_required_extensions::REQUIRED_EXTENSIONS, \
+    FPM_##FPM_MODE1 },
+#define DEF_SME_ZA_FUNCTION_GS(NAME, SHAPE, TYPES, GROUPS, PREDS, FPM_MODE2) \
   { #NAME, &functions::NAME##_za, &shapes::SHAPE, types_##TYPES, \
     groups_##GROUPS, preds_##PREDS, \
     aarch64_required_extensions::REQUIRED_EXTENSIONS \
-      .and_also (AARCH64_FL_ZA_ON) },
+      .and_also (AARCH64_FL_ZA_ON), FPM_##FPM_MODE2 },
 #include "aarch64-sve-builtins-sme.def"
 };
 
@@ -1180,6 +1183,7 @@ function_instance::hash () const
   h.add_int (type_suffix_ids[1]);
   h.add_int (group_suffix_id);
   h.add_int (pred);
+  h.add_int (fpm_mode);
   return h.end ();
 }
 
@@ -1606,7 +1610,8 @@ function_builder::add_overloaded_functions (const function_group_info &group,
     {
       function_instance instance (group.base_name, *group.base,
 				  *group.shape, mode, types,
-				  group_suffix_id, group.preds[pi]);
+				  group_suffix_id, group.preds[pi],
+				  group.fpm_mode);
       add_overloaded_function (instance, group.required_extensions);
     };
 
@@ -1784,7 +1789,7 @@ function_resolver::lookup_form (mode_suffix_index mode,
 {
   type_suffix_pair types = { type0, type1 };
   function_instance instance (base_name, base, shape, mode, types,
-			      group, pred);
+			      group, pred, fpm_mode);
   registered_function *rfn
     = function_table->find_with_hash (instance, instance.hash ());
   return rfn ? rfn->decl : NULL_TREE;
diff --git a/gcc/config/aarch64/aarch64-sve-builtins.def b/gcc/config/aarch64/aarch64-sve-builtins.def
index 47c396b866d..982f9ed2312 100644
--- a/gcc/config/aarch64/aarch64-sve-builtins.def
+++ b/gcc/config/aarch64/aarch64-sve-builtins.def
@@ -38,7 +38,7 @@
 #endif
 
 #ifndef DEF_SVE_FUNCTION_GS
-#define DEF_SVE_FUNCTION_GS(A, B, C, D, E)
+#define DEF_SVE_FUNCTION_GS(A, B, C, D, E, F)
 #endif
 
 #ifndef DEF_SVE_NEON_TYPE_SUFFIX
@@ -48,7 +48,7 @@
 
 #ifndef DEF_SVE_FUNCTION
 #define DEF_SVE_FUNCTION(NAME, SHAPE, TYPES, PREDS) \
-  DEF_SVE_FUNCTION_GS (NAME, SHAPE, TYPES, none, PREDS)
+  DEF_SVE_FUNCTION_GS (NAME, SHAPE, TYPES, none, PREDS, unused)
 #endif
 
 DEF_SVE_MODE (n, none, none, none)
diff --git a/gcc/config/aarch64/aarch64-sve-builtins.h b/gcc/config/aarch64/aarch64-sve-builtins.h
index 28726875401..41a9dfc56e5 100644
--- a/gcc/config/aarch64/aarch64-sve-builtins.h
+++ b/gcc/config/aarch64/aarch64-sve-builtins.h
@@ -28,6 +28,7 @@
    - the "mode" suffix ("_n", "_index", etc.)
    - the type suffixes ("_s32", "_b8", etc.)
    - the predication suffix ("_x", "_z", etc.)
+   - the "_fpm" suffix when the floating point mode register is set
 
    Each piece of information is individually useful, so we retain this
    classification throughout:
@@ -42,6 +43,8 @@
    - prediction_index extends the predication suffix with an additional
      alternative: PRED_implicit for implicitly-predicated operations
 
+   - fpm_mode represents whether the fpm register is set or not
+
    In addition to its unique full name, a function may have a shorter
    overloaded alias.  This alias removes pieces of the suffixes that
    can be inferred from the arguments, such as by shortening the mode
@@ -164,6 +167,14 @@ enum predication_index
   NUM_PREDS
 };
 
+/* Classifies intrinsics on whether they set the FPM register */
+enum fpm_mode_index
+{
+  FPM_unused,
+  FPM_set,
+  NUM_FPM_MODES
+};
+
 /* Classifies element types, based on type suffixes with the bit count
    removed.  "count" isn't really an element type, but we pretend it is
    for consistency.  */
@@ -366,6 +377,9 @@ struct function_group_info
 
   /* The architecture extensions that the functions require.  */
   aarch64_required_extensions required_extensions;
+  
+  /* Whether the floating point register is set */
+  fpm_mode_index fpm_mode;
 };
 
 /* Describes a single fully-resolved function (i.e. one that has a
@@ -376,7 +390,7 @@ public:
   function_instance (const char *, const function_base *,
 		     const function_shape *, mode_suffix_index,
 		     const type_suffix_pair &, group_suffix_index,
-		     predication_index);
+		     predication_index, fpm_mode_index);
 
   bool operator== (const function_instance &) const;
   bool operator!= (const function_instance &) const;
@@ -420,6 +434,7 @@ public:
   type_suffix_pair type_suffix_ids;
   group_suffix_index group_suffix_id;
   predication_index pred;
+  fpm_mode_index fpm_mode;
 };
 
 class registered_function;
@@ -878,10 +893,11 @@ function_instance (const char *base_name_in,
 		   mode_suffix_index mode_suffix_id_in,
 		   const type_suffix_pair &type_suffix_ids_in,
 		   group_suffix_index group_suffix_id_in,
-		   predication_index pred_in)
+		   predication_index pred_in,
+		   fpm_mode_index fpm_mode_in)
   : base_name (base_name_in), base (base_in), shape (shape_in),
     mode_suffix_id (mode_suffix_id_in), group_suffix_id (group_suffix_id_in),
-    pred (pred_in)
+    pred (pred_in), fpm_mode(fpm_mode_in)
 {
   memcpy (type_suffix_ids, type_suffix_ids_in, sizeof (type_suffix_ids));
 }
@@ -895,7 +911,8 @@ function_instance::operator== (const function_instance &other) const
 	  && type_suffix_ids[0] == other.type_suffix_ids[0]
 	  && type_suffix_ids[1] == other.type_suffix_ids[1]
 	  && group_suffix_id == other.group_suffix_id
-	  && pred == other.pred);
+	  && pred == other.pred
+	  && fpm_mode == other.fpm_mode);
 }
 
 inline bool

From patchwork Fri Nov  8 16:10:20 2024
Content-Type: text/plain; charset="utf-8"
MIME-Version: 1.0
Content-Transfer-Encoding: 7bit
X-Patchwork-Submitter: Claudio Bantaloukas <claudio.bantaloukas@arm.com>
X-Patchwork-Id: 2008635
Return-Path: <gcc-patches-bounces~incoming=patchwork.ozlabs.org@gcc.gnu.org>
X-Original-To: incoming@patchwork.ozlabs.org
Delivered-To: patchwork-incoming@legolas.ozlabs.org
Authentication-Results: legolas.ozlabs.org;
	dkim=pass (1024-bit key;
 unprotected) header.d=arm.com header.i=@arm.com header.a=rsa-sha256
 header.s=selector1 header.b=M4OXBv5+;
	dkim=pass (1024-bit key) header.d=arm.com header.i=@arm.com
 header.a=rsa-sha256 header.s=selector1 header.b=M4OXBv5+;
	dkim-atps=neutral
Authentication-Results: legolas.ozlabs.org;
 spf=pass (sender SPF authorized) smtp.mailfrom=gcc.gnu.org
 (client-ip=2620:52:3:1:0:246e:9693:128c; helo=server2.sourceware.org;
 envelope-from=gcc-patches-bounces~incoming=patchwork.ozlabs.org@gcc.gnu.org;
 receiver=patchwork.ozlabs.org)
Received: from server2.sourceware.org (server2.sourceware.org
 [IPv6:2620:52:3:1:0:246e:9693:128c])
	(using TLSv1.3 with cipher TLS_AES_256_GCM_SHA384 (256/256 bits)
	 key-exchange X25519 server-signature ECDSA (secp384r1) server-digest SHA384)
	(No client certificate requested)
	by legolas.ozlabs.org (Postfix) with ESMTPS id 4XlPBq4Zkfz1xyM
	for <incoming@patchwork.ozlabs.org>; Sat,  9 Nov 2024 03:13:52 +1100 (AEDT)
Received: from server2.sourceware.org (localhost [IPv6:::1])
	by sourceware.org (Postfix) with ESMTP id E84633858417
	for <incoming@patchwork.ozlabs.org>; Fri,  8 Nov 2024 16:13:50 +0000 (GMT)
X-Original-To: gcc-patches@gcc.gnu.org
Delivered-To: gcc-patches@gcc.gnu.org
Received: from EUR03-DBA-obe.outbound.protection.outlook.com
 (mail-dbaeur03on20620.outbound.protection.outlook.com
 [IPv6:2a01:111:f403:260d::620])
 by sourceware.org (Postfix) with ESMTPS id 327353858D21
 for <gcc-patches@gcc.gnu.org>; Fri,  8 Nov 2024 16:10:43 +0000 (GMT)
DMARC-Filter: OpenDMARC Filter v1.4.2 sourceware.org 327353858D21
Authentication-Results: sourceware.org;
 dmarc=pass (p=none dis=none) header.from=arm.com
Authentication-Results: sourceware.org; spf=pass smtp.mailfrom=arm.com
ARC-Filter: OpenARC Filter v1.0.0 sourceware.org 327353858D21
Authentication-Results: server2.sourceware.org;
 arc=pass smtp.remote-ip=2a01:111:f403:260d::620
ARC-Seal: i=3; a=rsa-sha256; d=sourceware.org; s=key; t=1731082251; cv=pass;
 b=x1E8og9uF1p7AiYgE3s/HoY/kY2aOJB9vS0u1NqMmnX0qBOqORyEdsj/pbdsljwn6iaR7T+xK+nZS9b0Z6BSYEyOgma4D/+7Jb0V63JFba+f9VUGYwjKrWpR8EX+ChubYmVdjD1H/nz/vuTtnSLTEYHaWKxb0YS3MqcAeiJTW7E=
ARC-Message-Signature: i=3; a=rsa-sha256; d=sourceware.org; s=key;
 t=1731082251; c=relaxed/simple;
 bh=CFuqNK2lSToLAeo0bt8kchDyMrUTh6G0FxX/sYZqDMI=;
 h=DKIM-Signature:DKIM-Signature:From:To:Subject:Date:Message-ID:
 MIME-Version;
 b=fo4j8vqYvWj06NifiXD5Sz9lJa9RjjH74EKcTswdk+uX/Dj2g5Vl1azLaEd28E3WdLmqyN/3P9UA/XXxyKPqMr57wdTUvzLYaigbg3vF5iNPX6HbuzXGf04+Ut/r53mSBAwWINitflNgqae+IpIQNiR9StoTpKAgk165Q+Q0oNA=
ARC-Authentication-Results: i=3; server2.sourceware.org
ARC-Seal: i=2; a=rsa-sha256; s=arcselector10001; d=microsoft.com; cv=pass;
 b=Rli/sqLiW5xAOX0U7KOgiGPs85lVpVbvrxmfSrvYDqh9zA4dx6AQlNFpcsAIzkZ7tK8FZAB6KmOTLw6NZNUM8eWRuAP6eE49xAP8ZVB8NcUl1o3SylfbVkTCnF5NPpjgiUVruCSGoZjF01bKhOPj6oBVaxPqO6jgIEsXo4S3jK3B1IhB7vCe12yzbXVxdcnxPcxjBI5GFc5EdpcRcZFeqfBuA8vQNczU3aPbZsZ4MVuxv/T+du8+FCOhbHHnKt2imHjRrIZJKS1rxH2jcXx1mTf7qiTYiXNxqN0pY9yMg/8sRtcG745V4TbIzLsJXnTAX76RkCptttYtTTkE7g79VA==
ARC-Message-Signature: i=2; a=rsa-sha256; c=relaxed/relaxed; d=microsoft.com;
 s=arcselector10001;
 h=From:Date:Subject:Message-ID:Content-Type:MIME-Version:X-MS-Exchange-AntiSpam-MessageData-ChunkCount:X-MS-Exchange-AntiSpam-MessageData-0:X-MS-Exchange-AntiSpam-MessageData-1;
 bh=AnamN11LRa1Vgvgb4TL/QLNrXJtrHbbN868kMvbFDDw=;
 b=UAverzQt7vK+5ETeYKIhcNBE0K8PMm+36xaCIC/Pui+ML98QSz6KHhzLBnPrYP4OHj1CvdLP14yKoNKU2cWduEtNE5GYqCj4uu3RH6EqHfxTTNMqp0XZd5JMrVFGD5jWmTRVq46+KoorKsmcIwabk7ijYl0NspevsT3OZPEwOlQj/UZ0D8MqEQKwZL4D47bJqUbKiHVQEJ7vFCO4XOl14TbAb4oco7do6xCg34ZNBpPaXVz+vnOx4juBDOsWB1J8uERShr/03w6ove7C8VmcbxhNptSdVvTIOiVavRvXe1sLQC5m2o9Y2PYlMCbNzAXRIdoLuJ0Hke9PM9FT4cUwBg==
ARC-Authentication-Results: i=2; mx.microsoft.com 1; spf=pass (sender ip is
 63.35.35.123) smtp.rcpttodomain=gcc.gnu.org smtp.mailfrom=arm.com; dmarc=pass
 (p=none sp=none pct=100) action=none header.from=arm.com; dkim=pass
 (signature was verified) header.d=arm.com; arc=pass (0 oda=1 ltdi=1
 spf=[1,1,smtp.mailfrom=arm.com] dmarc=[1,1,header.from=arm.com])
DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=arm.com; s=selector1;
 h=From:Date:Subject:Message-ID:Content-Type:MIME-Version:X-MS-Exchange-SenderADCheck;
 bh=AnamN11LRa1Vgvgb4TL/QLNrXJtrHbbN868kMvbFDDw=;
 b=M4OXBv5+Jree8BgZBIVfwzNuWvycqdcojc1gqIrVfia+77MGrM4Wgs2kppq/94BkxRBsh24tblzWOtTIWikHifvGCf/+IECgTurYQwpYTuf/Osekf4ReybmuGIuNk4BYI9D0K/FWxTvnmbFN2Lh/Axo0YJ2+UwUHKPp+my81FiQ=
Received: from AS4P191CA0036.EURP191.PROD.OUTLOOK.COM (2603:10a6:20b:657::18)
 by AM9PR08MB6179.eurprd08.prod.outlook.com (2603:10a6:20b:2da::9)
 with Microsoft SMTP Server (version=TLS1_2,
 cipher=TLS_ECDHE_RSA_WITH_AES_256_GCM_SHA384) id 15.20.8137.21; Fri, 8 Nov
 2024 16:10:38 +0000
Received: from AMS1EPF0000004C.eurprd04.prod.outlook.com
 (2603:10a6:20b:657:cafe::7b) by AS4P191CA0036.outlook.office365.com
 (2603:10a6:20b:657::18) with Microsoft SMTP Server (version=TLS1_2,
 cipher=TLS_ECDHE_RSA_WITH_AES_256_GCM_SHA384) id 15.20.8137.21 via Frontend
 Transport; Fri, 8 Nov 2024 16:10:38 +0000
X-MS-Exchange-Authentication-Results: spf=pass (sender IP is 63.35.35.123)
 smtp.mailfrom=arm.com; dkim=pass (signature was verified)
 header.d=arm.com;dmarc=pass action=none header.from=arm.com;
Received-SPF: Pass (protection.outlook.com: domain of arm.com designates
 63.35.35.123 as permitted sender) receiver=protection.outlook.com;
 client-ip=63.35.35.123; helo=64aa7808-outbound-1.mta.getcheckrecipient.com;
 pr=C
Received: from 64aa7808-outbound-1.mta.getcheckrecipient.com (63.35.35.123) by
 AMS1EPF0000004C.mail.protection.outlook.com (10.167.16.137) with
 Microsoft
 SMTP Server (version=TLS1_3, cipher=TLS_AES_256_GCM_SHA384) id 15.20.8137.17
 via Frontend Transport; Fri, 8 Nov 2024 16:10:36 +0000
Received: ("Tessian outbound b64574585bf8:v490");
 Fri, 08 Nov 2024 16:10:36 +0000
X-CheckRecipientChecked: true
X-CR-MTA-CID: 2109babc2b34b73f
X-TessianGatewayMetadata: 
 epcHXzkS2P/7VqODMv9EHWXKZIsWTj7bZxxCWwPyPqPz3ETKFK/JKWjAQrgq8qG9bBOJz5NCUE6aP5nPQ/92C2we8+/O6+7fJcZDZZMAigk15BgkWoGB40tWGplfX5F2Eu/yQJnP/7Xt+QZflcLUJrlBGg3F9NuZ6C3/3RNjYWA=
X-CR-MTA-TID: 64aa7808
Received: from L066d3fce5ccf.2
 by 64aa7808-outbound-1.mta.getcheckrecipient.com id
 B5B6A9AB-D388-4199-8093-9CE7A679BA0D.1;
 Fri, 08 Nov 2024 16:10:29 +0000
Received: from EUR03-DBA-obe.outbound.protection.outlook.com
 by 64aa7808-outbound-1.mta.getcheckrecipient.com with ESMTPS id
 L066d3fce5ccf.2 (version=TLSv1.3 cipher=TLS_AES_256_GCM_SHA384);
 Fri, 08 Nov 2024 16:10:29 +0000
ARC-Seal: i=1; a=rsa-sha256; s=arcselector10001; d=microsoft.com; cv=none;
 b=RpagJFKK63/x4pPd9jCoLji5Sc6g+saI3FIAvvs8ayy6VR7J499KwRQfW5FQTu4mVAdKtSd4leUCOKVKTmmi/Qsc0e86nAdGciWXWmazMSt04gT4o00Qz2tF3s3zUbR6c474R/Gm03PfLFAvOCUW7/Ak/nSQQKdUFmD8Wz3ZXJopvwEAtiOnCZ/Sg5WQdkzUdp3Ldb/YON9DQpKZ6+yQml6MiFPAeJ7Ryac5sWCdjJSTMY1l+Jwsh3uKUZgmu3K9rrHmLsZ5WlqSVDyiZE4lPOFrgTFHIVHjJ1AZBedzhLukkD/NgbfHfqyNgIbiJtmgCbxIo3fMKOJpdQ15ozzk1A==
ARC-Message-Signature: i=1; a=rsa-sha256; c=relaxed/relaxed; d=microsoft.com;
 s=arcselector10001;
 h=From:Date:Subject:Message-ID:Content-Type:MIME-Version:X-MS-Exchange-AntiSpam-MessageData-ChunkCount:X-MS-Exchange-AntiSpam-MessageData-0:X-MS-Exchange-AntiSpam-MessageData-1;
 bh=AnamN11LRa1Vgvgb4TL/QLNrXJtrHbbN868kMvbFDDw=;
 b=XrDhkMKm+ap4XVrpJC3p8lnlYPrdNtwaA4Fldwc/UWu+acvhzqsZ/TsBcPhxX581LOa+eJXdQ+NH0KLcaWY2m0bEod+mLzYymdD0nSPYoFQV9P+yLk9IKCbcWO1kYOLZfaci7TD/nIOVsrpX0kKvTLBtZXnCa+VOWoeGs7zCi7SbCK+96B5fUaFW7m/QtbEiT4Iu0jndQnGuQeHgcipGK6oJtD8djfUx7XNG7SBnTLnjxObqbixdysS/vFSFxjYkekFtNELHgUXHXD4EeReaSvipeNv57ICbfMEGiOyw6Fwh7gvr7rL8CzqJ0OkIISe8CyUkhbh6EaJIKz5ulHYXTQ==
ARC-Authentication-Results: i=1; mx.microsoft.com 1; spf=pass (sender ip is
 40.67.248.234) smtp.rcpttodomain=gcc.gnu.org smtp.mailfrom=arm.com;
 dmarc=pass (p=none sp=none pct=100) action=none header.from=arm.com;
 dkim=none (message not signed); arc=none (0)
DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=arm.com; s=selector1;
 h=From:Date:Subject:Message-ID:Content-Type:MIME-Version:X-MS-Exchange-SenderADCheck;
 bh=AnamN11LRa1Vgvgb4TL/QLNrXJtrHbbN868kMvbFDDw=;
 b=M4OXBv5+Jree8BgZBIVfwzNuWvycqdcojc1gqIrVfia+77MGrM4Wgs2kppq/94BkxRBsh24tblzWOtTIWikHifvGCf/+IECgTurYQwpYTuf/Osekf4ReybmuGIuNk4BYI9D0K/FWxTvnmbFN2Lh/Axo0YJ2+UwUHKPp+my81FiQ=
Received: from DUZPR01CA0289.eurprd01.prod.exchangelabs.com
 (2603:10a6:10:4b7::20) by DB9PR08MB7865.eurprd08.prod.outlook.com
 (2603:10a6:10:39c::15) with Microsoft SMTP Server (version=TLS1_2,
 cipher=TLS_ECDHE_RSA_WITH_AES_256_GCM_SHA384) id 15.20.8137.19; Fri, 8 Nov
 2024 16:10:26 +0000
Received: from DB5PEPF00014B8D.eurprd02.prod.outlook.com
 (2603:10a6:10:4b7:cafe::f2) by DUZPR01CA0289.outlook.office365.com
 (2603:10a6:10:4b7::20) with Microsoft SMTP Server (version=TLS1_2,
 cipher=TLS_ECDHE_RSA_WITH_AES_256_GCM_SHA384) id 15.20.8137.21 via Frontend
 Transport; Fri, 8 Nov 2024 16:10:26 +0000
X-MS-Exchange-Authentication-Results: spf=pass (sender IP is 40.67.248.234)
 smtp.mailfrom=arm.com; dkim=none (message not signed)
 header.d=none;dmarc=pass action=none header.from=arm.com;
Received-SPF: Pass (protection.outlook.com: domain of arm.com designates
 40.67.248.234 as permitted sender) receiver=protection.outlook.com;
 client-ip=40.67.248.234; helo=nebula.arm.com; pr=C
Received: from nebula.arm.com (40.67.248.234) by
 DB5PEPF00014B8D.mail.protection.outlook.com (10.167.8.201) with Microsoft
 SMTP Server (version=TLS1_2, cipher=TLS_ECDHE_RSA_WITH_AES_128_GCM_SHA256) id
 15.20.8137.17 via Frontend Transport; Fri, 8 Nov 2024 16:10:26 +0000
Received: from AZ-NEU-EX02.Emea.Arm.com (10.251.26.5) by AZ-NEU-EX03.Arm.com
 (10.251.24.31) with Microsoft SMTP Server (version=TLS1_2,
 cipher=TLS_ECDHE_RSA_WITH_AES_128_GCM_SHA256) id 15.1.2507.39; Fri, 8 Nov
 2024 16:10:26 +0000
Received: from AZ-NEU-EX04.Arm.com (10.251.24.32) by AZ-NEU-EX02.Emea.Arm.com
 (10.251.26.5) with Microsoft SMTP Server (version=TLS1_2,
 cipher=TLS_ECDHE_RSA_WITH_AES_128_GCM_SHA256) id 15.1.2507.39; Fri, 8 Nov
 2024 16:10:25 +0000
Received: from 221664dbf3aa.euhpc2.arm.com (10.58.86.32) by mail.arm.com
 (10.251.24.32) with Microsoft SMTP Server id 15.1.2507.39 via Frontend
 Transport; Fri, 8 Nov 2024 16:10:25 +0000
From: Claudio Bantaloukas <claudio.bantaloukas@arm.com>
To: <gcc-patches@gcc.gnu.org>
CC: Claudio Bantaloukas <claudio.bantaloukas@arm.com>
Subject: [PATCH v2 4/4] aarch64: add svcvt* FP8 intrinsics
Date: Fri, 8 Nov 2024 16:10:20 +0000
Message-ID: <20241108161020.921071-5-claudio.bantaloukas@arm.com>
X-Mailer: git-send-email 2.43.0
In-Reply-To: <20241108161020.921071-1-claudio.bantaloukas@arm.com>
References: <20241108161020.921071-1-claudio.bantaloukas@arm.com>
MIME-Version: 1.0
X-EOPAttributedMessage: 1
X-MS-TrafficTypeDiagnostic: 
 DB5PEPF00014B8D:EE_|DB9PR08MB7865:EE_|AMS1EPF0000004C:EE_|AM9PR08MB6179:EE_
X-MS-Office365-Filtering-Correlation-Id: 7bf275af-15d5-4449-7e17-08dd000fe1ca
x-checkrecipientrouted: true
NoDisclaimer: true
X-MS-Exchange-SenderADCheck: 1
X-MS-Exchange-AntiSpam-Relay: 0
X-Microsoft-Antispam-Untrusted: BCL:0;
 ARA:13230040|36860700013|82310400026|1800799024|376014;
X-Microsoft-Antispam-Message-Info-Original: 
 ZaHQkvyX4DdKjz/G5zdgETjIXB6xBad95jFF77p6/WSmy0wJ7C5r6VkxBzayGlYPh/PiJrVMUMZ5c+FyCt2FMZvl9Zt37orJPhjAOsZGqEowxBRKDidz+IrhP7YRR+9LYLmGJfWNWXcK9u1bXGJhrb42nMC6Ou35b2oHulwNiiv7faTZHceG8tfVfl/ojSGGxjNdnkQKqbu8TwhDzHBUrINUgdy3CXxFPv1fgVt8yUaqCkr4IIs9LoNBPqEH/jPMp/5NOIcdnL1pgKVBs0U5U72/45xQeyGDvYkb1ySRyP8Kb8aQTpSCQcyM0bLYlu5u68j1y8DoRn7twUf6+34WJtwUAy+vBav9UsDJySOmH55OoBqTYUnR6yVVZZ7ebmQz9ts79/1mmHMsC2JAiL9G08EopJYy1NEJr45lSirM53eC6CJLiE+alH4dvsqfBXSWrKXykDxsDdZaBng3jPNkN6XOIDZpzUfxM0Icc4d8Irszh0K+UBTMvVsO8dGsjJW0UEQbGVsEqTPPq54WSHd90CZptPqGZmjZGwe40RcsJRdoZSDaHMxpfSpSdFvWK1ZYGNQ2vhZdKzpLqfbSG3PJV/r9mE8+UU6qxuTDoLtcgdEzR+77unQfnSg+IPaRNgLhBgiOsNkljL9Oy/fMqCWhD2WwZDwmt2pKSemNHeGNWOcPBAYv+os70Vt/ON/vbinTUZP77Ozw7T1C8Lmm8dOI8gmSQNsWMpiJd9NRW+Hunew+Ew8vv15k87A94ReKZ1ClLcRRRUWzs1K9RIncJ29QSDYihaG+qJHt85AarhgZdzH56ektUX4dmjACJuJgUU4uDElF4ZaNJyKzTOzeREx0oHH09yT2Vw7phs6LT07v2oKtPlBpdNOZFz5L9hUGB/fNipPR6QWOeB96wwInpFw1KFeZW0L0eFzbtIOhbxULFC5QkGSFgqMyw8j6m+V7JDRVCtPJFc/iTR/s2AGvfwL2l4tyANAq3s4wkV/YfZ4ssQrdspFDRsP1w/i2k8TzD9aKyO9u83kaKLeUmOcJV4iGPAV/N2dTepNWxAIK1Gz6rJPKGgdgBQiRAjnhEL6wBV5ZnKHsUMtB1C0Mez6/8ns+GQevyFOKXOPWJg6HWFO2d41/DVYwqEoNhVXJSjJXUF6keNJCzWM1IG535JJoLxEgI54x5Vs5VXEYijVSwRXA8dnNuOJzVlnDwzHA4K5X4dHELgB1rGUhEoAyQvtOOOqQBSw81eRLJLc/EWxEmKGyX1Kjd7rHDwrMoxhbEq5Nbh0ZL/hywyFmtSt4yhe3YS0qQbp/EKhkxj0mH+HpHycIdAeNcSnJ9uSGVbRyZ69h0hyTXlD7sXvyP3pVZyIBt1/H86inLQYzF//kHtQcWNNx7w/2YwabEHIXIIgKLIyoXiyJ
X-Forefront-Antispam-Report-Untrusted: CIP:40.67.248.234; CTRY:IE; LANG:en;
 SCL:1; SRV:; IPV:NLI; SFV:NSPM; H:nebula.arm.com; PTR:InfoDomainNonexistent;
 CAT:NONE; SFS:(13230040)(36860700013)(82310400026)(1800799024)(376014);
 DIR:OUT; SFP:1101;
X-MS-Exchange-Transport-CrossTenantHeadersStamped: DB9PR08MB7865
X-MS-Exchange-SkipListedInternetSender: ip=[2603:10a6:10:4b7::20];
 domain=DUZPR01CA0289.eurprd01.prod.exchangelabs.com
X-MS-Exchange-Transport-CrossTenantHeadersStripped: 
 AMS1EPF0000004C.eurprd04.prod.outlook.com
X-MS-PublicTrafficType: Email
X-MS-Office365-Filtering-Correlation-Id-Prvs: 
 ebb48417-f1a0-404e-8e5c-08dd000fdbd2
X-Microsoft-Antispam: BCL:0;
 ARA:13230040|35042699022|14060799003|82310400026|1800799024|36860700013|376014;
X-Microsoft-Antispam-Message-Info: =?utf-8?q?HVRQTMvLuHAvglFzB8M5/9wG05d01Ap?=
	=?utf-8?q?1qrER8lqf3K5QxSZFURnrQo2ovo7je9mgqtQeSvL+TZhNZs4bt6Q6uEXDOEIsZ32D?=
	=?utf-8?q?4hGzRf2C9cLUNzJwBCt1bPCMM9VhOV6Q+IuNd8cvuLG1JXhMaxtc8exnWnrl6oZo0?=
	=?utf-8?q?5BmH/9MYdNRD7H1pAgHysdjvgQ4aOqF5iz1G5vdjjitC91bf1FFOWGCFcvFCHPyC7?=
	=?utf-8?q?ahviPWiTSnftGD5Di7kc35+DM54QdiLdSTtshIpD68qSZgmPAj3vQn/hbqndDowht?=
	=?utf-8?q?KwoHfyoT2SNL4TqNdLNXJLi8+XMsbTG9RF4ZF7iAxxEROW+j+kLsxWXivjDYuFoIv?=
	=?utf-8?q?g5Cn0W36e5WXRPP9v9oEYyxtOYZ5EcQX+VY53YjxJu/l0pr3H6HmdsQoCr4SqZB28?=
	=?utf-8?q?wEpguqKQVhalkxwBgJKehAEqT8gqpSCKqbtV5tKXuXii1xFzL4WR0nbxOFo7Ddzh0?=
	=?utf-8?q?IbM2I/HEKCiNgSNeIoGmouHKfGmX8ni+4yBSiizbvUoT+MHR1PrrP+LsIKUDSHBLH?=
	=?utf-8?q?Hkkn0Jve1+QV1XaDwj8LZ5Phvcv/hrwifES8PtxgEewpi7pd+LXICSVKOyMGajY5W?=
	=?utf-8?q?HLAuTPK75qf9lrpAV8XVmFnTX5AqH8X7A6KqPheIwhH3pPBKI79a/NAyBr2fVkkH/?=
	=?utf-8?q?+qQTDj8AOsPIhWBqmCslN8rZ3KGVgfHuFdiAdwcaa7EL24dXjbERXW9i5A9EFgG9E?=
	=?utf-8?q?zJmmGXY6E2fSmCocKv2x0Uq6X+8kDtTWS9SmPiNB0QwNKZhmXZvRlbk/LLXfCxTtU?=
	=?utf-8?q?t9r8O0qfesSKUxuY/fghIVUgXqLhoDqtE8GnM/2mNiVupGmqh4SidUMzcC/TTtQtQ?=
	=?utf-8?q?eGnRovg7lZeXzElnoOeTM2nnK4UFHgWet6b+/yLxXkLffIT2AhYkqFQDXdDosGouJ?=
	=?utf-8?q?LaUhMkpaJ5QGoIeO8q4eQPL0jBiffAH+c+8LHE7dU2V/CJaaur5JncmnM8DJE5oyq?=
	=?utf-8?q?nbVdP0JZ6T/Svlt1jMyaTXExteNh3vHy+TBALOiA+mXMTr9lzNms5qqinuVea6jGS?=
	=?utf-8?q?thg5cjvlladZHX2aGs16odHDc2WNdq/O613vj02m2ZH55Qx0ZebOH9bSiaOk2EZWm?=
	=?utf-8?q?HvBSJLCpspg1jQyPIuF6mSpHu2ul4zohBIpx+TgU4eV0X5RegLbUnFhpXXk0E0Ni2?=
	=?utf-8?q?PRe7xTkyHvP9Sn8FC7MJOC7bsvmzQ9niB2VQxpB3mIOaa4Nr3WIesKkiQKercjO4s?=
	=?utf-8?q?G02VHFgO7IuceDGbM/RF2MSPIyqyKt1B6JVN/o+4TxpWD/c/Yx943H9z+BQqswyhc?=
	=?utf-8?q?fbmJUsT6j3T4uDY1KxNKOkQo0EIPsD/u+IXtOw45kk4AZdreahVd9PRSBtQnW0Bge?=
	=?utf-8?q?hocq4z3X0+KE?=
X-Forefront-Antispam-Report: CIP:63.35.35.123; CTRY:IE; LANG:en; SCL:1; SRV:;
 IPV:CAL; SFV:NSPM; H:64aa7808-outbound-1.mta.getcheckrecipient.com;
 PTR:ec2-63-35-35-123.eu-west-1.compute.amazonaws.com; CAT:NONE;
 SFS:(13230040)(35042699022)(14060799003)(82310400026)(1800799024)(36860700013)(376014);
 DIR:OUT; SFP:1101;
X-OriginatorOrg: arm.com
X-MS-Exchange-CrossTenant-OriginalArrivalTime: 08 Nov 2024 16:10:36.8350 (UTC)
X-MS-Exchange-CrossTenant-Network-Message-Id: 
 7bf275af-15d5-4449-7e17-08dd000fe1ca
X-MS-Exchange-CrossTenant-Id: f34e5979-57d9-4aaa-ad4d-b122a662184d
X-MS-Exchange-CrossTenant-OriginalAttributedTenantConnectingIp: 
 TenantId=f34e5979-57d9-4aaa-ad4d-b122a662184d; Ip=[63.35.35.123];
 Helo=[64aa7808-outbound-1.mta.getcheckrecipient.com]
X-MS-Exchange-CrossTenant-AuthSource: 
 AMS1EPF0000004C.eurprd04.prod.outlook.com
X-MS-Exchange-CrossTenant-AuthAs: Anonymous
X-MS-Exchange-CrossTenant-FromEntityHeader: HybridOnPrem
X-MS-Exchange-Transport-CrossTenantHeadersStamped: AM9PR08MB6179
X-BeenThere: gcc-patches@gcc.gnu.org
X-Mailman-Version: 2.1.30
Precedence: list
List-Id: Gcc-patches mailing list <gcc-patches.gcc.gnu.org>
List-Unsubscribe: <https://gcc.gnu.org/mailman/options/gcc-patches>,
 <mailto:gcc-patches-request@gcc.gnu.org?subject=unsubscribe>
List-Archive: <https://gcc.gnu.org/pipermail/gcc-patches/>
List-Post: <mailto:gcc-patches@gcc.gnu.org>
List-Help: <mailto:gcc-patches-request@gcc.gnu.org?subject=help>
List-Subscribe: <https://gcc.gnu.org/mailman/listinfo/gcc-patches>,
 <mailto:gcc-patches-request@gcc.gnu.org?subject=subscribe>
Errors-To: gcc-patches-bounces~incoming=patchwork.ozlabs.org@gcc.gnu.org

This patch adds the following intrinsics:
- svcvt1_bf16[_mf8]_fpm
- svcvt1_f16[_mf8]_fpm
- svcvt2_bf16[_mf8]_fpm
- svcvt2_f16[_mf8]_fpm
- svcvtlt1_bf16[_mf8]_fpm
- svcvtlt1_f16[_mf8]_fpm
- svcvtlt2_bf16[_mf8]_fpm
- svcvtlt2_f16[_mf8]_fpm
- svcvtn_mf8[_f16_x2]_fpm (unpredicated)
- svcvtnb_mf8[_f32_x2]_fpm
- svcvtnt_mf8[_f32_x2]_fpm

The underlying instructions are only available when SVE2 is enabled and the PE
is not in streaming SVE mode. They are also available when SME2 is enabled and
the PE is in streaming SVE mode.

gcc/
	* config/aarch64/aarch64-sve-builtins-shapes.cc
	(parse_signature): Add an fpm_t (uint64_t) argument to functions that
	set the fpm register.
	(unary_convert_narrowxn_fpm_def): New class.
	(unary_convert_narrowxn_fpm): New shape.
	(unary_convertxn_fpm_def): New class.
	(unary_convertxn_fpm): New shape.
	* config/aarch64/aarch64-sve-builtins-shapes.h
	(unary_convert_narrowxn_fpm): Declare.
	(unary_convertxn_fpm): Likewise.
	* config/aarch64/aarch64-sve-builtins-sve2.cc
	(svcvt_fp8_impl): New class.
	(svcvtn_impl): Handle fp8 cases.
	(svcvt1, svcvt2, svcvtlt1, svcvtlt2): Add new FUNCTION.
	(svcvtnb): Likewise.
	* config/aarch64/aarch64-sve-builtins-sve2.def
	(svcvt1, svcvt2, svcvtlt1, svcvtlt2): Add new DEF_SVE_FUNCTION_GS.
	(svcvtn): Likewise.
	(svcvtnb, svcvtnt): Likewise.
	* config/aarch64/aarch64-sve-builtins-sve2.h
	(svcvt1, svcvt2, svcvtlt1, svcvtlt2, svcvtnb, svcvtnt): Declare.
	* config/aarch64/aarch64-sve-builtins.cc
	(TYPES_cvt_mf8, TYPES_cvtn_mf8, TYPES_cvtnx_mf8): Add new types arrays.
	(function_builder::get_name): Append _fpm to functions that set fpmr.
	(function_resolver::check_gp_argument): Deal with the fpm_t argument.
	(function_expander::use_exact_insn): Set the fpm register before
	calling the insn if the function warrants it.
	* config/aarch64/aarch64-sve2.md (@aarch64_sve2_fp8_cvt): Add new.
	(@aarch64_sve2_fp8_cvtn): Likewise.
	(@aarch64_sve2_fp8_cvtnb): Likewise.
	(@aarch64_sve_cvtnt): Likewise.
	* config/aarch64/aarch64.h (TARGET_SSVE_FP8): Add new.
	* config/aarch64/iterators.md
	(VNx8SF_ONLY, SVE_FULL_HFx2): New mode iterators.
	(UNSPEC_F1CVT, UNSPEC_F1CVTLT, UNSPEC_F2CVT, UNSPEC_F2CVTLT): Add new.
	(UNSPEC_FCVTNB, UNSPEC_FCVTNT): Likewise.
	(UNSPEC_FP8FCVTN): Likewise.
	(FP8CVT_UNS, fp8_cvt_uns_op): Likewise.

gcc/testsuite/

	* gcc.target/aarch64/sve/acle/asm/test_sve_acle.h
	(TEST_DUAL_Z): Add fpm0 argument
	* gcc.target/aarch64/sve/acle/general-c/unary_convert_narrowxn_fpm_1.c:
	Add new tests.
	* gcc.target/aarch64/sve/acle/general-c/unary_convertxn_fpm_1.c:
	Likewise.
	* gcc.target/aarch64/sve2/acle/asm/cvt_mf8.c: Likewise.
	* gcc.target/aarch64/sve2/acle/asm/cvtlt_mf8.c: Likewise.
	* gcc.target/aarch64/sve2/acle/asm/cvtn_mf8.c: Likewise.
	* lib/target-supports.exp: Add aarch64_asm_fp8_ok check.
---
 .../aarch64/aarch64-sve-builtins-shapes.cc    | 74 +++++++++++++++++++
 .../aarch64/aarch64-sve-builtins-shapes.h     |  2 +
 .../aarch64/aarch64-sve-builtins-sve2.cc      | 28 ++++++-
 .../aarch64/aarch64-sve-builtins-sve2.def     | 12 +++
 .../aarch64/aarch64-sve-builtins-sve2.h       |  6 ++
 gcc/config/aarch64/aarch64-sve-builtins.cc    | 30 +++++++-
 gcc/config/aarch64/aarch64-sve2.md            | 52 +++++++++++++
 gcc/config/aarch64/aarch64.h                  |  5 ++
 gcc/config/aarch64/iterators.md               | 25 +++++++
 .../aarch64/sve/acle/asm/test_sve_acle.h      |  2 +-
 .../general-c/unary_convert_narrowxn_fpm_1.c  | 38 ++++++++++
 .../acle/general-c/unary_convertxn_fpm_1.c    | 60 +++++++++++++++
 .../aarch64/sve2/acle/asm/cvt_mf8.c           | 48 ++++++++++++
 .../aarch64/sve2/acle/asm/cvtlt_mf8.c         | 47 ++++++++++++
 .../aarch64/sve2/acle/asm/cvtn_mf8.c          | 59 +++++++++++++++
 gcc/testsuite/lib/target-supports.exp         |  2 +-
 16 files changed, 485 insertions(+), 5 deletions(-)
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/general-c/unary_convert_narrowxn_fpm_1.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve/acle/general-c/unary_convertxn_fpm_1.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/cvt_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/cvtlt_mf8.c
 create mode 100644 gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/cvtn_mf8.c

diff --git a/gcc/config/aarch64/aarch64-sve-builtins-shapes.cc b/gcc/config/aarch64/aarch64-sve-builtins-shapes.cc
index 51f7cfdf96f..f08c377f5e4 100644
--- a/gcc/config/aarch64/aarch64-sve-builtins-shapes.cc
+++ b/gcc/config/aarch64/aarch64-sve-builtins-shapes.cc
@@ -325,6 +325,8 @@ parse_signature (const function_instance &instance, const char *format,
 	argument_types.quick_push (argument_type);
     }
   gcc_assert (format[0] == 0);
+  if (instance.fpm_mode == FPM_set)
+    argument_types.quick_push(get_typenode_from_name (UINT64_TYPE));
   return return_type;
 }
 
@@ -4316,6 +4318,44 @@ struct unary_convert_narrowt_def : public overloaded_base<1>
 };
 SHAPE (unary_convert_narrowt)
 
+/* sv<t0>x<g0>_t svfoo_t0[_t1_g]_fpm(sv<t0>x<g0>_t, sv<t1>x<g1>_t, fpm_t)
+
+   Similar to unary_convert_narrowt but for tuple arguments with support for
+   modal floating point.  */
+struct unary_convert_narrowxn_fpm_def : public overloaded_base<1>
+{
+  bool
+  explicit_group_suffix_p () const override
+  {
+    return false;
+  }
+
+  bool
+  has_merge_argument_p (const function_instance &, unsigned int) const override
+  {
+    return true;
+  }
+
+  void
+  build (function_builder &b, const function_group_info &group) const override
+  {
+    b.add_overloaded_functions (group, MODE_none);
+    build_all (b, "v0,v0,t1", group, MODE_none);
+  }
+  
+  tree
+  resolve (function_resolver &r) const override
+  {
+    sve_type type;
+    if (!r.check_num_arguments (3) || !(type = r.infer_sve_type (1))
+	|| !r.require_derived_scalar_type (2, TYPE_unsigned, 64))
+      return error_mark_node;
+
+    return r.resolve_to (r.mode_suffix_id, type);
+  }
+};
+SHAPE (unary_convert_narrowxn_fpm)
+
 /* sv<t0>x<g0>_t svfoo_t0[_t1_g](sv<t1>x<g1>_t)
 
    where the target type <t0> must be specified explicitly but the
@@ -4348,6 +4388,40 @@ struct unary_convertxn_def : public unary_convert_def
 };
 SHAPE (unary_convertxn)
 
+/* sv<t0>x<g0>_t svfoo_t0[_t1_g]_fpm(sv<t1>x<g1>_t, fpm_t)
+
+   where the target type <t0> must be specified explicitly but the
+   source type <t1> can be inferred.
+
+   Functions with a group suffix are unpredicated. */
+struct unary_convertxn_fpm_def : public unary_convert_def
+{
+  bool explicit_group_suffix_p () const override { return false; }
+
+  void
+  build (function_builder &b, const function_group_info &group) const override
+  {
+    b.add_overloaded_functions (group, MODE_none);
+    build_all (b, "v0,t1", group, MODE_none);
+  }
+
+  tree
+  resolve (function_resolver &r) const override
+  {
+    if (r.pred != PRED_none)
+      return unary_convert_def::resolve (r);
+
+    sve_type type;
+    if (!r.check_num_arguments (2)
+	|| !(type = r.infer_sve_type (0))
+	|| !r.require_derived_scalar_type (1, TYPE_unsigned, 64))
+      return error_mark_node;
+
+    return r.resolve_to (r.mode_suffix_id, type);
+  }
+};
+SHAPE (unary_convertxn_fpm)
+
 /* sv<t0>_t svfoo[_t0](sv<t0:half>_t).  */
 struct unary_long_def : public overloaded_base<0>
 {
diff --git a/gcc/config/aarch64/aarch64-sve-builtins-shapes.h b/gcc/config/aarch64/aarch64-sve-builtins-shapes.h
index ea87240518d..ddb1f720c65 100644
--- a/gcc/config/aarch64/aarch64-sve-builtins-shapes.h
+++ b/gcc/config/aarch64/aarch64-sve-builtins-shapes.h
@@ -217,7 +217,9 @@ namespace aarch64_sve
     extern const function_shape *const unary;
     extern const function_shape *const unary_convert;
     extern const function_shape *const unary_convert_narrowt;
+    extern const function_shape *const unary_convert_narrowxn_fpm;
     extern const function_shape *const unary_convertxn;
+    extern const function_shape *const unary_convertxn_fpm;
     extern const function_shape *const unary_long;
     extern const function_shape *const unary_n;
     extern const function_shape *const unary_narrowb;
diff --git a/gcc/config/aarch64/aarch64-sve-builtins-sve2.cc b/gcc/config/aarch64/aarch64-sve-builtins-sve2.cc
index d09b75b60c2..28a5b60d4a2 100644
--- a/gcc/config/aarch64/aarch64-sve-builtins-sve2.cc
+++ b/gcc/config/aarch64/aarch64-sve-builtins-sve2.cc
@@ -174,13 +174,34 @@ public:
   }
 };
 
+class svcvt_fp8_impl : public function_base
+{
+public:
+  CONSTEXPR
+  svcvt_fp8_impl (int unspec) : m_unspec (unspec) {}
+
+  rtx
+  expand (function_expander &e) const override
+  {
+    return e.use_exact_insn (code_for_aarch64_sve2_fp8_cvt (m_unspec,
+							    e.result_mode ()));
+  }
+
+  int m_unspec;
+};
+
 class svcvtn_impl : public function_base
 {
 public:
   rtx
   expand (function_expander &e) const override
   {
-    return e.use_exact_insn (code_for_aarch64_sve_cvtn (e.result_mode ()));
+    if (e.fpm_mode == FPM_set)
+      return e
+	  .use_exact_insn (code_for_aarch64_sve2_fp8_cvtn (GET_MODE (e.args
+									 [0])));
+    else
+      return e.use_exact_insn (code_for_aarch64_sve_cvtn (e.result_mode ()));
   }
 };
 
@@ -633,8 +654,13 @@ FUNCTION (svbsl2n, CODE_FOR_MODE0 (aarch64_sve2_bsl2n),)
 FUNCTION (svcdot, svcdot_impl,)
 FUNCTION (svcdot_lane, svcdot_lane_impl,)
 FUNCTION (svclamp, svclamp_impl,)
+FUNCTION (svcvt1, svcvt_fp8_impl, (UNSPEC_F1CVT))
+FUNCTION (svcvt2, svcvt_fp8_impl, (UNSPEC_F2CVT))
+FUNCTION (svcvtlt1, svcvt_fp8_impl, (UNSPEC_F1CVTLT))
+FUNCTION (svcvtlt2, svcvt_fp8_impl, (UNSPEC_F2CVTLT))
 FUNCTION (svcvtlt, unspec_based_function, (-1, -1, UNSPEC_COND_FCVTLT))
 FUNCTION (svcvtn, svcvtn_impl,)
+FUNCTION (svcvtnb, fixed_insn_function, (CODE_FOR_aarch64_sve2_fp8_cvtnb_vnx8sf))
 FUNCTION (svcvtx, unspec_based_function, (-1, -1, UNSPEC_COND_FCVTX))
 FUNCTION (svcvtxnt, CODE_FOR_MODE1 (aarch64_sve2_cvtxnt),)
 FUNCTION (sveor3, CODE_FOR_MODE0 (aarch64_sve2_eor3),)
diff --git a/gcc/config/aarch64/aarch64-sve-builtins-sve2.def b/gcc/config/aarch64/aarch64-sve-builtins-sve2.def
index 8d25bb33dad..f846ebe79ce 100644
--- a/gcc/config/aarch64/aarch64-sve-builtins-sve2.def
+++ b/gcc/config/aarch64/aarch64-sve-builtins-sve2.def
@@ -302,3 +302,15 @@ DEF_SVE_FUNCTION_GS (svzipq, unaryxn, all_data, x24, none, unused)
 DEF_SVE_FUNCTION (svamax, binary_opt_single_n, all_float, mxz)
 DEF_SVE_FUNCTION (svamin, binary_opt_single_n, all_float, mxz)
 #undef REQUIRED_EXTENSIONS
+
+#define REQUIRED_EXTENSIONS \
+  sve_and_sme (AARCH64_FL_SVE2 | AARCH64_FL_FP8, \
+	       AARCH64_FL_SME2 | AARCH64_FL_FP8)
+DEF_SVE_FUNCTION_GS (svcvt1, unary_convert, cvt_mf8, none, none, set)
+DEF_SVE_FUNCTION_GS (svcvt2, unary_convert, cvt_mf8, none, none, set)
+DEF_SVE_FUNCTION_GS (svcvtlt1, unary_convert, cvt_mf8, none, none, set)
+DEF_SVE_FUNCTION_GS (svcvtlt2, unary_convert, cvt_mf8, none, none, set)
+DEF_SVE_FUNCTION_GS (svcvtn, unary_convertxn_fpm, cvtn_mf8, x2, none, set)
+DEF_SVE_FUNCTION_GS (svcvtnb, unary_convertxn_fpm, cvtnx_mf8, x2, none, set)
+DEF_SVE_FUNCTION_GS (svcvtnt, unary_convert_narrowxn_fpm, cvtnx_mf8, x2, none, set)
+#undef REQUIRED_EXTENSIONS
diff --git a/gcc/config/aarch64/aarch64-sve-builtins-sve2.h b/gcc/config/aarch64/aarch64-sve-builtins-sve2.h
index 013a9dfc5fa..f1584e9dcfc 100644
--- a/gcc/config/aarch64/aarch64-sve-builtins-sve2.h
+++ b/gcc/config/aarch64/aarch64-sve-builtins-sve2.h
@@ -59,8 +59,14 @@ namespace aarch64_sve
     extern const function_base *const svcdot_lane;
     extern const function_base *const svclamp;
     extern const function_base *const svcntp;
+    extern const function_base *const svcvt1;
+    extern const function_base *const svcvt2;
+    extern const function_base *const svcvtlt1;
+    extern const function_base *const svcvtlt2;
     extern const function_base *const svcvtlt;
     extern const function_base *const svcvtn;
+    extern const function_base *const svcvtnb;
+    extern const function_base *const svcvtnt;
     extern const function_base *const svcvtx;
     extern const function_base *const svcvtxnt;
     extern const function_base *const sveor3;
diff --git a/gcc/config/aarch64/aarch64-sve-builtins.cc b/gcc/config/aarch64/aarch64-sve-builtins.cc
index dfe6221e5c2..fe2d4986051 100644
--- a/gcc/config/aarch64/aarch64-sve-builtins.cc
+++ b/gcc/config/aarch64/aarch64-sve-builtins.cc
@@ -453,6 +453,20 @@ CONSTEXPR const group_suffix_info group_suffixes[] = {
   D (f32, s32), \
   D (f32, u32)
 
+/* _f16_mf8
+   _bf16_mf8.  */
+#define TYPES_cvt_mf8(S, D) \
+  D (f16, mf8), D (bf16, mf8)
+
+/* _mf8_f16
+   _mf8_bf16.  */
+#define TYPES_cvtn_mf8(S, D) \
+  D (mf8, f16), D (mf8, bf16)
+
+/* _mf8_f32.  */
+#define TYPES_cvtnx_mf8(S, D) \
+  D (mf8, f32)
+
 /* { _s32 _s64 } x { _b8 _b16 _b32 _b64 }
    { _u32 _u64 }.  */
 #define TYPES_inc_dec_n1(D, A) \
@@ -752,9 +766,12 @@ DEF_SVE_TYPES_ARRAY (cvt);
 DEF_SVE_TYPES_ARRAY (cvt_bfloat);
 DEF_SVE_TYPES_ARRAY (cvt_h_s_float);
 DEF_SVE_TYPES_ARRAY (cvt_long);
+DEF_SVE_TYPES_ARRAY (cvt_mf8);
 DEF_SVE_TYPES_ARRAY (cvt_narrow_s);
 DEF_SVE_TYPES_ARRAY (cvt_narrow);
 DEF_SVE_TYPES_ARRAY (cvt_s_s);
+DEF_SVE_TYPES_ARRAY (cvtn_mf8);
+DEF_SVE_TYPES_ARRAY (cvtnx_mf8);
 DEF_SVE_TYPES_ARRAY (inc_dec_n);
 DEF_SVE_TYPES_ARRAY (qcvt_x2);
 DEF_SVE_TYPES_ARRAY (qcvt_x4);
@@ -1370,6 +1387,8 @@ function_builder::get_name (const function_instance &instance,
   if (!overloaded_p || instance.shape->explicit_group_suffix_p ())
     append_name (instance.group_suffix ().string);
   append_name (pred_suffixes[instance.pred]);
+  if (instance.fpm_mode == FPM_set)
+    append_name ("_fpm");
   return finish_name ();
 }
 
@@ -2992,11 +3011,12 @@ function_resolver::check_gp_argument (unsigned int nops,
 {
   gcc_assert (pred != PRED_za_m);
   i = 0;
+  unsigned int nfpm_args = (fpm_mode == FPM_set)? 1:0;
   if (pred != PRED_none)
     {
       /* Unary merge operations should use resolve_unary instead.  */
       gcc_assert (!shape->has_merge_argument_p (*this, nops));
-      nargs = nops + 1;
+      nargs = nops + nfpm_args + 1;
       if (!check_num_arguments (nargs)
 	  || !require_vector_type (i, gp_type_index ()))
 	return false;
@@ -3004,7 +3024,7 @@ function_resolver::check_gp_argument (unsigned int nops,
     }
   else
     {
-      nargs = nops;
+      nargs = nops + nfpm_args;
       if (!check_num_arguments (nargs))
 	return false;
     }
@@ -4124,6 +4144,12 @@ function_expander::use_exact_insn (insn_code icode)
     }
   for (unsigned int i = 0; i < nops; ++i)
     add_input_operand (icode, args[i]);
+  if (fpm_mode == FPM_set)
+    {
+      // The last element of these functions is always an fpm_t
+      gcc_assert(args.last()->mode == DImode);
+      emit_move_insn (gen_rtx_REG (DImode, FPM_REGNUM), args.last ());
+    }
   return generate_insn (icode);
 }
 
diff --git a/gcc/config/aarch64/aarch64-sve2.md b/gcc/config/aarch64/aarch64-sve2.md
index ac27124fb74..629523e7a45 100644
--- a/gcc/config/aarch64/aarch64-sve2.md
+++ b/gcc/config/aarch64/aarch64-sve2.md
@@ -2676,6 +2676,14 @@ (define_insn "@aarch64_<optab>_lane_<mode>"
 ;; ---- [FP<-FP] Widening conversions
 ;; -------------------------------------------------------------------------
 ;; Includes:
+;; - BF1CVT
+;; - BF1CVTLT
+;; - BF2CVT
+;; - BF2CVTLT
+;; - F1CVT
+;; - F1CVTLT
+;; - F2CVT
+;; - F2CVTLT
 ;; - FCVTLT
 ;; -------------------------------------------------------------------------
 
@@ -2741,6 +2749,17 @@ (define_insn "*cond_<sve_fp_op><mode>_strict"
   "<sve_fp_op>\t%0.<Vetype>, %1/m, %2.<Ventype>"
 )
 
+(define_insn "@aarch64_sve2_fp8_cvt_<fp8_cvt_uns_op><SVE_FULL_HF:mode>"
+  [(set (match_operand:SVE_FULL_HF 0 "register_operand" "=w")
+	(unspec:SVE_FULL_HF
+	  [(match_operand:VNx16QI_ONLY 1 "register_operand" "w")
+	  (reg:DI FPM_REGNUM)]
+	  FP8CVT_UNS)
+	  )]
+  "TARGET_SSVE_FP8"
+  "<b><fp8_cvt_uns_op>\t%0.h, %1.b"
+)
+
 ;; -------------------------------------------------------------------------
 ;; ---- [FP<-FP] Narrowing conversions
 ;; -------------------------------------------------------------------------
@@ -2865,6 +2884,8 @@ (define_insn "@aarch64_sve2_cvtxnt<mode>"
 ;; - BFCVTN
 ;; - FCVT
 ;; - FCVTN
+;; - FCVTNB
+;; - FCVTNT
 ;; -------------------------------------------------------------------------
 
 (define_insn "truncvnx8sf<mode>2"
@@ -2884,6 +2905,37 @@ (define_insn "@aarch64_sve_cvtn<mode>"
   "<b>fcvtn\t%0.h, %1"
 )
 
+(define_insn "@aarch64_sve2_fp8_cvtn_<SVE_FULL_HFx2:mode>"
+  [(set (match_operand:VNx16QI_ONLY 0 "register_operand" "=w")
+	(unspec:VNx16QI_ONLY
+	  [(match_operand:SVE_FULL_HFx2 1 "aligned_register_operand" "Uw2")
+	   (reg:DI FPM_REGNUM)]
+	  UNSPEC_FP8FCVTN))]
+  "TARGET_SSVE_FP8"
+  "<b>fcvtn\t%0.b, %1"
+)
+
+(define_insn "@aarch64_sve2_fp8_cvtnb_<VNx8SF_ONLY:mode>"
+  [(set (match_operand:VNx16QI_ONLY 0 "register_operand" "=w")
+	(unspec:VNx16QI_ONLY
+	  [(match_operand:VNx8SF_ONLY 1 "aligned_register_operand" "Uw2")
+	   (reg:DI FPM_REGNUM)]
+	  UNSPEC_FCVTNB))]
+  "TARGET_SSVE_FP8"
+  "fcvtnb\t%0.b, %1"
+)
+
+(define_insn "@aarch64_sve_cvtnt<mode>"
+  [(set (match_operand:VNx16QI_ONLY 0 "register_operand" "=w")
+	(unspec:VNx16QI_ONLY
+	  [(match_operand:VNx16QI_ONLY 1 "register_operand" "0")
+	   (match_operand:VNx8SF 2 "aligned_register_operand" "Uw2")
+	   (reg:DI FPM_REGNUM)]
+	  UNSPEC_FCVTNT))]
+  "TARGET_SSVE_FP8"
+  "fcvtnt\t%0.b, %2"
+)
+
 ;; -------------------------------------------------------------------------
 ;; ---- [FP<-INT] Multi-vector conversions
 ;; -------------------------------------------------------------------------
diff --git a/gcc/config/aarch64/aarch64.h b/gcc/config/aarch64/aarch64.h
index 593319fd472..7e1aeb74ea1 100644
--- a/gcc/config/aarch64/aarch64.h
+++ b/gcc/config/aarch64/aarch64.h
@@ -483,6 +483,11 @@ constexpr auto AARCH64_FL_DEFAULT_ISA_MODE ATTRIBUTE_UNUSED
 /* fp8 instructions are enabled through +fp8.  */
 #define TARGET_FP8 AARCH64_HAVE_ISA (FP8)
 
+/* Some fp8 instructions require +fp8 and one of +sve2 or +sme2.  */
+#define TARGET_SSVE_FP8 (TARGET_FP8 \
+			 && (TARGET_SVE2 || TARGET_STREAMING) \
+			 && (TARGET_SME2 || TARGET_NON_STREAMING))
+
 /* Standard register usage.  */
 
 /* 31 64-bit general purpose registers R0-R30:
diff --git a/gcc/config/aarch64/iterators.md b/gcc/config/aarch64/iterators.md
index 8269b0cdcd9..f9f16676219 100644
--- a/gcc/config/aarch64/iterators.md
+++ b/gcc/config/aarch64/iterators.md
@@ -432,6 +432,7 @@ (define_mode_iterator VNx16SI_ONLY [VNx16SI])
 (define_mode_iterator VNx8HI_ONLY [VNx8HI])
 (define_mode_iterator VNx8BF_ONLY [VNx8BF])
 (define_mode_iterator VNx8SI_ONLY [VNx8SI])
+(define_mode_iterator VNx8SF_ONLY [VNx8SF])
 (define_mode_iterator VNx8DI_ONLY [VNx8DI])
 (define_mode_iterator VNx4SI_ONLY [VNx4SI])
 (define_mode_iterator VNx4SF_ONLY [VNx4SF])
@@ -465,6 +466,9 @@ (define_mode_iterator SVE_FULL_BHSIx2 [VNx32QI VNx16HI VNx8SI])
 ;; Fully-packed SVE vector modes that have 16-bit float elements.
 (define_mode_iterator SVE_FULL_HF [VNx8BF VNx8HF])
 
+;; Pairs of the above.
+(define_mode_iterator SVE_FULL_HFx2 [VNx16BF VNx16HF])
+
 ;; Fully-packed SVE vector modes that have 16-bit, 32-bit or 64-bit elements.
 (define_mode_iterator SVE_FULL_HSD [VNx8HI VNx4SI VNx2DI
 				    VNx8BF VNx8HF VNx4SF VNx2DF])
@@ -937,7 +941,13 @@ (define_c_enum "unspec"
     UNSPEC_COND_FLOGB	; Used in aarch64-sve2.md.
     UNSPEC_EORBT	; Used in aarch64-sve2.md.
     UNSPEC_EORTB	; Used in aarch64-sve2.md.
+    UNSPEC_F1CVT	; Used in aarch64-sve2.md.
+    UNSPEC_F1CVTLT	; Used in aarch64-sve2.md.
+    UNSPEC_F2CVT	; Used in aarch64-sve2.md.
+    UNSPEC_F2CVTLT	; Used in aarch64-sve2.md.
     UNSPEC_FADDP	; Used in aarch64-sve2.md.
+    UNSPEC_FCVTNB	; Used in aarch64-sve2.md.
+    UNSPEC_FCVTNT	; Used in aarch64-sve2.md.
     UNSPEC_FMAXNMP	; Used in aarch64-sve2.md.
     UNSPEC_FMAXP	; Used in aarch64-sve2.md.
     UNSPEC_FMINNMP	; Used in aarch64-sve2.md.
@@ -946,6 +956,7 @@ (define_c_enum "unspec"
     UNSPEC_FMLALT	; Used in aarch64-sve2.md.
     UNSPEC_FMLSLB	; Used in aarch64-sve2.md.
     UNSPEC_FMLSLT	; Used in aarch64-sve2.md.
+    UNSPEC_FP8FCVTN	; Used in aarch64-sve2.md.
     UNSPEC_HISTCNT	; Used in aarch64-sve2.md.
     UNSPEC_HISTSEG	; Used in aarch64-sve2.md.
     UNSPEC_LD1_COUNT	; Used in aarch64-sve2.md.
@@ -4534,3 +4545,17 @@ (define_int_attr faminmax_uns_op
 
 (define_code_attr faminmax_op
   [(smax "famax") (smin "famin")])
+
+;; Iterators and attributes for fp8 sve/sme conversions
+
+(define_int_iterator FP8CVT_UNS
+  [UNSPEC_F1CVT
+   UNSPEC_F2CVT
+   UNSPEC_F1CVTLT
+   UNSPEC_F2CVTLT])
+
+(define_int_attr fp8_cvt_uns_op
+  [(UNSPEC_F1CVT "f1cvt")
+   (UNSPEC_F2CVT "f2cvt")
+   (UNSPEC_F1CVTLT "f1cvtlt")
+   (UNSPEC_F2CVTLT "f2cvtlt")])
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/test_sve_acle.h b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/test_sve_acle.h
index 367024be863..8048c488a28 100644
--- a/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/test_sve_acle.h
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/asm/test_sve_acle.h
@@ -75,7 +75,7 @@
 #define TEST_DUAL_Z(NAME, TYPE1, TYPE2, CODE1, CODE2)		\
   PROTO (NAME, TYPE1, (TYPE1 z0, TYPE1 z1, TYPE1 z2, TYPE1 z3,	\
 		       TYPE2 z4, TYPE2 z5, TYPE2 z6, TYPE2 z7,	\
-		       svbool_t p0, svbool_t p1))		\
+		       svbool_t p0, svbool_t p1, fpm_t fpm0))	\
   {								\
     INVOKE (CODE1, CODE2);					\
     return z0;							\
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/general-c/unary_convert_narrowxn_fpm_1.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/general-c/unary_convert_narrowxn_fpm_1.c
new file mode 100644
index 00000000000..ab97eef3472
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/general-c/unary_convert_narrowxn_fpm_1.c
@@ -0,0 +1,38 @@
+#include <arm_sve.h>
+
+#pragma GCC target "+sme2+fp8"
+
+void
+test (svmfloat8_t f8, svfloat32x2_t f32x2, fpm_t fpm0,
+      svfloat16x2_t f16x2, svfloat16x4_t f16x4,
+      svfloat32x3_t f32x3, svfloat32x4_t f32x4,
+      svbool_t pg, float f, svint8_t s8, svint32x2_t s32x2)
+  __arm_streaming
+{
+  svcvtnt_mf8_fpm (f8, f32x2, fpm0);
+
+  svcvtnt_mf8_fpm (); /* { dg-error {too few arguments to function 'svcvtnt_mf8_fpm'} } */
+  
+  svcvtnt_mf8_fpm (f8); /* { dg-error {too few arguments to function 'svcvtnt_mf8_fpm'} } */
+  svcvtnt_mf8_fpm (f32x2); /* { dg-error {too few arguments to function 'svcvtnt_mf8_fpm'} } */
+  svcvtnt_mf8_fpm (fpm0); /* { dg-error {too few arguments to function 'svcvtnt_mf8_fpm'} } */
+  svcvtnt_mf8_fpm (f); /* { dg-error {too few arguments to function 'svcvtnt_mf8_fpm'} } */
+  svcvtnt_mf8_fpm (f8, f32x2); /* { dg-error {too few arguments to function 'svcvtnt_mf8_fpm'} } */
+  svcvtnt_mf8_fpm (f32x2, fpm0); /* { dg-error {too few arguments to function 'svcvtnt_mf8_fpm'} } */
+  svcvtnt_mf8_fpm (f8, fpm0); /* { dg-error {too few arguments to function 'svcvtnt_mf8_fpm'} } */
+  svcvtnt_mf8_fpm (pg); /* { dg-error {too few arguments to function 'svcvtnt_mf8_fpm'} } */
+  svcvtnt_mf8_fpm (s8); /* { dg-error {too few arguments to function 'svcvtnt_mf8_fpm'} } */
+
+  svcvtnt_mf8_fpm (f8, f16x2, fpm0); /* { dg-error {'svcvtnt_mf8_fpm' has no form that takes 'svfloat16x2_t' arguments} } */
+  svcvtnt_mf8_fpm (f8, f16x4, fpm0); /* { dg-error {'svcvtnt_mf8_fpm' has no form that takes 'svfloat16x4_t' arguments} } */
+  svcvtnt_mf8_fpm (f8, f32x3, fpm0); /* { dg-error {'svcvtnt_mf8_fpm' has no form that takes 'svfloat32x3_t' arguments} } */
+  svcvtnt_mf8_fpm (f8, f32x4, fpm0); /* { dg-error {'svcvtnt_mf8_fpm' has no form that takes 'svfloat32x4_t' arguments} } */
+
+  svcvtnt_mf8_fpm (f8, 0, fpm0); /* { dg-error {passing 'int' to argument 2 of 'svcvtnt_mf8_fpm', which expects an SVE type rather than a scalar type} } */
+  svcvtnt_mf8_fpm (f8, f, fpm0); /* { dg-error {passing 'float' to argument 2 of 'svcvtnt_mf8_fpm', which expects an SVE type rather than a scalar type} } */
+  svcvtnt_mf8_fpm (f8, pg, fpm0); /* { dg-error {'svcvtnt_mf8_fpm' has no form that takes 'svbool_t' arguments} } */
+  svcvtnt_mf8_fpm (f8, s8, fpm0); /* { dg-error {'svcvtnt_mf8_fpm' has no form that takes 'svint8_t' arguments} } */
+  svcvtnt_mf8_fpm (f8, s32x2, fpm0); /* { dg-error {'svcvtnt_mf8_fpm' has no form that takes 'svint32x2_t' arguments} } */
+  
+  svcvtnt_mf8_fpm (f8, f32x2, f32x2); /* { dg-error {passing 'svfloat32x2_t' to argument 3 of 'svcvtnt_mf8_fpm', which expects 'uint64_t'} } */
+}
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/general-c/unary_convertxn_fpm_1.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/general-c/unary_convertxn_fpm_1.c
new file mode 100644
index 00000000000..d312e857d81
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve/acle/general-c/unary_convertxn_fpm_1.c
@@ -0,0 +1,60 @@
+#include <arm_sve.h>
+
+#pragma GCC target "+sme2+fp8"
+
+void
+test (svfloat16x2_t f16x2, svbfloat16x2_t bf16x2, svfloat32x2_t f32x2,
+      svfloat16x3_t f16x3, svfloat16x4_t f16x4,
+      svfloat32x3_t f32x3, svfloat32x4_t f32x4,
+      fpm_t fpm0,
+      svbool_t pg, float f, svint8_t s8, svint32x2_t s32x2)
+  __arm_streaming
+{
+  svcvtn_mf8_fpm (f16x2, fpm0);
+  svcvtn_mf8_fpm (bf16x2, fpm0);
+
+  svcvtn_mf8_fpm (); /* { dg-error {too few arguments to function 'svcvtn_mf8_fpm'} } */
+  
+  svcvtn_mf8_fpm (f16x2); /* { dg-error {too few arguments to function 'svcvtn_mf8_fpm'} } */
+  svcvtn_mf8_fpm (fpm0); /* { dg-error {too few arguments to function 'svcvtn_mf8_fpm'} } */
+  
+  svcvtn_mf8_fpm (f); /* { dg-error {too few arguments to function 'svcvtn_mf8_fpm'} } */
+  svcvtn_mf8_fpm (pg); /* { dg-error {too few arguments to function 'svcvtn_mf8_fpm'} } */
+  svcvtn_mf8_fpm (s8); /* { dg-error {too few arguments to function 'svcvtn_mf8_fpm'} } */
+
+  svcvtn_mf8_fpm (f16x2, f16x2, fpm0); /* { dg-error {too many arguments to function 'svcvtn_mf8_fpm'} } */
+
+  svcvtn_mf8_fpm (f16x3, fpm0); /* { dg-error {'svcvtn_mf8_fpm' has no form that takes 'svfloat16x3_t' arguments} } */
+  svcvtn_mf8_fpm (f16x4, fpm0); /* { dg-error {'svcvtn_mf8_fpm' has no form that takes 'svfloat16x4_t' arguments} } */
+  svcvtn_mf8_fpm (0, fpm0); /* { dg-error {passing 'int' to argument 1 of 'svcvtn_mf8_fpm', which expects an SVE type rather than a scalar type} } */
+  svcvtn_mf8_fpm (f, fpm0); /* { dg-error {passing 'float' to argument 1 of 'svcvtn_mf8_fpm', which expects an SVE type rather than a scalar type} } */
+  svcvtn_mf8_fpm (pg, fpm0); /* { dg-error {'svcvtn_mf8_fpm' has no form that takes 'svbool_t' arguments} } */
+  svcvtn_mf8_fpm (s8, fpm0); /* { dg-error {'svcvtn_mf8_fpm' has no form that takes 'svint8_t' arguments} } */
+  svcvtn_mf8_fpm (s32x2, fpm0); /* { dg-error {'svcvtn_mf8_fpm' has no form that takes 'svint32x2_t' arguments} } */
+  
+  svcvtn_mf8_fpm (f16x2, f16x2); /* { dg-error {passing 'svfloat16x2_t' to argument 2 of 'svcvtn_mf8_fpm', which expects 'uint64_t'} } */
+
+
+  svcvtnb_mf8_fpm (f32x2, fpm0);
+
+  svcvtnb_mf8_fpm (); /* { dg-error {too few arguments to function 'svcvtnb_mf8_fpm'} } */
+  
+  svcvtnb_mf8_fpm (f32x2); /* { dg-error {too few arguments to function 'svcvtnb_mf8_fpm'} } */
+  svcvtnb_mf8_fpm (fpm0); /* { dg-error {too few arguments to function 'svcvtnb_mf8_fpm'} } */
+  
+  svcvtnb_mf8_fpm (f); /* { dg-error {too few arguments to function 'svcvtnb_mf8_fpm'} } */
+  svcvtnb_mf8_fpm (pg); /* { dg-error {too few arguments to function 'svcvtnb_mf8_fpm'} } */
+  svcvtnb_mf8_fpm (s8); /* { dg-error {too few arguments to function 'svcvtnb_mf8_fpm'} } */
+
+  svcvtnb_mf8_fpm (f32x2, f32x2, fpm0); /* { dg-error {too many arguments to function 'svcvtnb_mf8_fpm'} } */
+
+  svcvtnb_mf8_fpm (f32x3, fpm0); /* { dg-error {'svcvtnb_mf8_fpm' has no form that takes 'svfloat32x3_t' arguments} } */
+  svcvtnb_mf8_fpm (f32x4, fpm0); /* { dg-error {'svcvtnb_mf8_fpm' has no form that takes 'svfloat32x4_t' arguments} } */
+  svcvtnb_mf8_fpm (0, fpm0); /* { dg-error {passing 'int' to argument 1 of 'svcvtnb_mf8_fpm', which expects an SVE type rather than a scalar type} } */
+  svcvtnb_mf8_fpm (f, fpm0); /* { dg-error {passing 'float' to argument 1 of 'svcvtnb_mf8_fpm', which expects an SVE type rather than a scalar type} } */
+  svcvtnb_mf8_fpm (pg, fpm0); /* { dg-error {'svcvtnb_mf8_fpm' has no form that takes 'svbool_t' arguments} } */
+  svcvtnb_mf8_fpm (s8, fpm0); /* { dg-error {'svcvtnb_mf8_fpm' has no form that takes 'svint8_t' arguments} } */
+  svcvtnb_mf8_fpm (s32x2, fpm0); /* { dg-error {'svcvtnb_mf8_fpm' has no form that takes 'svint32x2_t' arguments} } */
+  
+  svcvtnb_mf8_fpm (f32x2, f32x2); /* { dg-error {passing 'svfloat32x2_t' to argument 2 of 'svcvtnb_mf8_fpm', which expects 'uint64_t'} } */
+}
diff --git a/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/cvt_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/cvt_mf8.c
new file mode 100644
index 00000000000..b6b616bb9b3
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/cvt_mf8.c
@@ -0,0 +1,48 @@
+/* { dg-additional-options "-march=armv8.5-a+sve2+bf16+fp8" } */
+/* { dg-require-effective-target aarch64_asm_fp8_ok }  */
+/* { dg-require-effective-target aarch64_asm_bf16_ok }  */
+/* { dg-skip-if "" { *-*-* } { "-DSTREAMING_COMPATIBLE" } { "" } } */
+
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** cvt1_f16_mf8_fpm:
+**	msr	fpmr, x0
+**	f1cvt	z0\.h, z4\.b
+**	ret
+*/
+TEST_DUAL_Z (cvt1_f16_mf8_fpm, svfloat16_t, svmfloat8_t,
+	     z0 = svcvt1_f16_mf8_fpm (z4, fpm0),
+	     z0 = svcvt1_f16_fpm (z4, fpm0))
+
+/*
+** cvt1_bf16_mf8_fpm:
+**	msr	fpmr, x0
+**	bf1cvt	z0\.h, z4\.b
+**	ret
+*/
+TEST_DUAL_Z (cvt1_bf16_mf8_fpm, svbfloat16_t, svmfloat8_t,
+	     z0 = svcvt1_bf16_mf8_fpm (z4, fpm0),
+	     z0 = svcvt1_bf16_fpm (z4, fpm0))
+
+/*
+** cvt2_f16_mf8_fpm:
+**	msr	fpmr, x0
+**	f2cvt	z0\.h, z4\.b
+**	ret
+*/
+TEST_DUAL_Z (cvt2_f16_mf8_fpm, svfloat16_t, svmfloat8_t,
+	     z0 = svcvt2_f16_mf8_fpm (z4, fpm0),
+	     z0 = svcvt2_f16_fpm (z4, fpm0))
+
+/*
+** cvt2_bf16_mf8_fpm:
+**	msr	fpmr, x0
+**	bf2cvt	z0\.h, z4\.b
+**	ret
+*/
+TEST_DUAL_Z (cvt2_bf16_mf8_fpm, svbfloat16_t, svmfloat8_t,
+	     z0 = svcvt2_bf16_mf8_fpm (z4, fpm0),
+	     z0 = svcvt2_bf16_fpm (z4, fpm0))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/cvtlt_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/cvtlt_mf8.c
new file mode 100644
index 00000000000..4ff68c53e22
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/cvtlt_mf8.c
@@ -0,0 +1,47 @@
+/* { dg-additional-options "-march=armv8.5-a+sve2+bf16+fp8" } */
+/* { dg-require-effective-target aarch64_asm_fp8_ok }  */
+/* { dg-require-effective-target aarch64_asm_bf16_ok }  */
+/* { dg-skip-if "" { *-*-* } { "-DSTREAMING_COMPATIBLE" } { "" } } */
+
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+
+#include "test_sve_acle.h"
+/*
+** cvtlt1_f16_mf8_fpm:
+**	msr	fpmr, x0
+**	f1cvtlt	z0\.h, z4\.b
+**	ret
+*/
+TEST_DUAL_Z (cvtlt1_f16_mf8_fpm, svfloat16_t, svmfloat8_t,
+	     z0 = svcvtlt1_f16_mf8_fpm (z4, fpm0),
+	     z0 = svcvtlt1_f16_fpm (z4, fpm0))
+
+/*
+** cvtlt1_bf16_mf8_fpm:
+**	msr	fpmr, x0
+**	bf1cvtlt	z0\.h, z4\.b
+**	ret
+*/
+TEST_DUAL_Z (cvtlt1_bf16_mf8_fpm, svbfloat16_t, svmfloat8_t,
+	     z0 = svcvtlt1_bf16_mf8_fpm (z4, fpm0),
+	     z0 = svcvtlt1_bf16_fpm (z4, fpm0))
+
+/*
+** cvtlt2_f16_mf8_fpm:
+**	msr	fpmr, x0
+**	f2cvtlt	z0\.h, z4\.b
+**	ret
+*/
+TEST_DUAL_Z (cvtlt2_f16_mf8_fpm, svfloat16_t, svmfloat8_t,
+	     z0 = svcvtlt2_f16_mf8_fpm (z4, fpm0),
+	     z0 = svcvtlt2_f16_fpm (z4, fpm0))
+
+/*
+** cvtlt2_bf16_mf8_fpm:
+**	msr	fpmr, x0
+**	bf2cvtlt	z0\.h, z4\.b
+**	ret
+*/
+TEST_DUAL_Z (cvtlt2_bf16_mf8_fpm, svbfloat16_t, svmfloat8_t,
+	     z0 = svcvtlt2_bf16_mf8_fpm (z4, fpm0),
+	     z0 = svcvtlt2_bf16_fpm (z4, fpm0))
diff --git a/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/cvtn_mf8.c b/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/cvtn_mf8.c
new file mode 100644
index 00000000000..82188f8ca9a
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/cvtn_mf8.c
@@ -0,0 +1,59 @@
+/* { dg-additional-options "-march=armv8.5-a+sve2+bf16+fp8" } */
+/* { dg-require-effective-target aarch64_asm_fp8_ok }  */
+/* { dg-require-effective-target aarch64_asm_bf16_ok }  */
+/* { dg-skip-if "" { *-*-* } { "-DSTREAMING_COMPATIBLE" } { "" } } */
+
+/* { dg-final { check-function-bodies "**" "" "-DCHECK_ASM" } } */
+
+#include "test_sve_acle.h"
+
+/*
+** cvtn_mf8_f16_x2_fpm:
+**	msr	fpmr, x2
+**	fcvtn	z0\.b, {z4\.h(?:, | - )z5\.h}
+**	ret
+*/
+TEST_DUAL_Z (cvtn_mf8_f16_x2_fpm, svmfloat8_t, svfloat16x2_t,
+	   z0 = svcvtn_mf8_f16_x2_fpm (z4, fpm0),
+	   z0 = svcvtn_mf8_fpm (z4, fpm0))
+
+/*
+** cvtn_mf8_bf16_x2_fpm:
+**	msr	fpmr, x2
+**	bfcvtn	z0\.b, {z4\.h(?:, | - )z5\.h}
+**	ret
+*/
+TEST_DUAL_Z (cvtn_mf8_bf16_x2_fpm, svmfloat8_t, svbfloat16x2_t,
+	   z0 = svcvtn_mf8_bf16_x2_fpm (z4, fpm0),
+	   z0 = svcvtn_mf8_fpm (z4, fpm0))
+
+/*
+** cvtnb_mf8_f32_x2_fpm:
+**	msr	fpmr, x2
+**	fcvtnb	z0\.b, {z4\.s(?:, | - )z5\.s}
+**	ret
+*/
+TEST_DUAL_Z (cvtnb_mf8_f32_x2_fpm, svmfloat8_t, svfloat32x2_t,
+	   z0 = svcvtnb_mf8_f32_x2_fpm (z4, fpm0),
+	   z0 = svcvtnb_mf8_fpm (z4, fpm0))
+
+/*
+** cvtnt_mf8_f32_x2_fpm_untied:
+**	msr	fpmr, x2
+**	fcvtnt	z1\.b, {z4\.s(?:, | - )z5\.s}
+**	mov	z0.d, z1.d
+**	ret
+*/
+TEST_DUAL_Z (cvtnt_mf8_f32_x2_fpm_untied, svmfloat8_t, svfloat32x2_t,
+	   z0 = svcvtnt_mf8_f32_x2_fpm (z1, z4, fpm0),
+	   z0 = svcvtnt_mf8_fpm (z1, z4, fpm0))
+
+/*
+** cvtnt_mf8_f32_x2_fpm_tied:
+**	msr	fpmr, x2
+**	fcvtnt	z0\.b, {z4\.s(?:, | - )z5\.s}
+**	ret
+*/
+TEST_DUAL_Z (cvtnt_mf8_f32_x2_fpm_tied, svmfloat8_t, svfloat32x2_t,
+	   z0 = svcvtnt_mf8_f32_x2_fpm (z0, z4, fpm0),
+	   z0 = svcvtnt_mf8_fpm (z0, z4, fpm0))
diff --git a/gcc/testsuite/lib/target-supports.exp b/gcc/testsuite/lib/target-supports.exp
index 0c2fd83f45c..ec4e6be1a12 100644
--- a/gcc/testsuite/lib/target-supports.exp
+++ b/gcc/testsuite/lib/target-supports.exp
@@ -12121,7 +12121,7 @@ proc check_effective_target_aarch64_tiny { } {
 
 foreach { aarch64_ext } { "fp" "simd" "crypto" "crc" "lse" "dotprod" "sve"
 			  "i8mm" "f32mm" "f64mm" "bf16" "sb" "sve2" "ls64"
-			  "sme" "sme-i16i64" "sme2" } {
+			  "sme" "sme-i16i64" "sme2" "fp8" } {
     eval [string map [list FUNC $aarch64_ext] {
 	proc check_effective_target_aarch64_asm_FUNC_ok { } {
 	  if { [istarget aarch64*-*-*] } {